天津11选5开奖信息:elasticsearch概念

作者: 魯智深 分類: java 發布時間: 2018-05-11 22:58

基本概念

天津11选5中奖结果 www.ebzvaz.com.cn 1、集群:一個或者多個節點組織在一起,比如有3臺服務器加在一起就是集群
2、節點:一個節點是集群中的一個服務器,由一個名字來標識,默認是一個一個隨機的漫畫角色的名字
3、分片:將索引劃分為多份的能力,允許水平分割和擴展容量,多個分片響應請求,提高性能和吞吐量。
4、副本:創建分片的一份或者多份的能力,在一個節點失敗其余節點可以頂上,比如我們某一個節點掛了,其他節點就能頂上。

在elasticsearch中index == mysql 數據庫,type == 表,documents == 行,field == 列

elasticsearch是基于RESTful接口進行操作,所以需要去了解http請求方式GET,POST,PUT,DELETE,OPTIONS

倒排索引

一般情況下都是正排索引,我們通過關鍵詞去搜索需要的文檔在給到需要內容,當數據量非常大的時候,正排索引就會出現問題。那么我們用到倒排索引,倒排索引就是通過關鍵詞去搜索單詞,通過會匹配相關的文檔內容。

簡單記為:
正排索引:文檔 —> 單詞

倒排索引:單詞 —> 文檔

倒排索引

倒排索引

但是這樣是不完善,了解seo的程序員就知道還會有一個權重的問題,比如關鍵詞在文章中出現的次數,如果出現次數越多,那么此文章就權重越到,排名越靠前。

關鍵詞權重

關鍵詞權重

此為倒排索引最簡單的原理,但類似谷歌,百度這類搜索引擎,其權重排序問題更加復雜。

如果覺得我的文章對您有用,請隨意打賞。您的支持將鼓勵我繼續創作!

發表評論

電子郵件地址不會被公開。 必填項已用*標注