京东搜索引擎原理

32533 0

2015-12-17 00:54:15 发表在 京东| 查看全部阅读模式

1.爬虫和抓取

搜索引擎派出一个能够在网上发现新网页并抓文件的程序，这个程序通常称之为蜘蛛。搜索引擎从已知的数据库出发，就像正常用户的浏览器一样访问这些网页并抓取文件。

2.索引

　蜘蛛抓取的页面文件分解、分析，并以巨大表格的形式存入数据库。

3.搜索词处理

在搜索引擎界面输入关键词，单击“搜索”按钮后，搜索引擎程序即对搜索词进行处理，如中文分词处理，判断是否需要整合类目属性信息，判断是否有拼写错误或错别字等情况。搜索词的处理必须十分快速。

4.排序

对搜索词处理后，搜索引擎程序从索引数据库中找出所有包含搜索词的商品，并且根据排名算法计算出哪些网页应该排在前面，然后按照一定格式返回到“搜索”页面。

搜索相关性原理

1、仅标题部分、广告词、类目建索引、用户搜索到的商品需在标题中出现

2、按字切词、索引，保证查全率

3、精确匹配与模糊匹配

4、相关性权重涉及因素：词频、词间距、是否有广告词

5、标题中应含有品牌、型号、类别、关键属性、功能、别称等

6、搜索词与类目关系：商品相关性与商品分类、用户点击有关

7、业务原则和用户搜索原则；例如：用户搜索：“篮球”

搜索排序原理

1、相关性排序计算：标题、类目、属性、销量、评论数、价格等因素的综合

2、交易性排序计算：销量、价格

3、评论数排序计算：好评度、评论数计算

4、时效性排序计算：上架时间

5、综合各种相关性与商品的商业属性综合算出的排序分值。

搜索排序筛选

1、销量排序：七日销量，价格权重，好评度

2、价格排序：按照商品的价格进行高低排序

3、好评度排序：好评度、全部评论数综合因素

4、商品上架时间：按照商品上架时间排列

搜索下拉框提示：

数据来源：用户搜索词，搜索日志

排序：按照相关性进行排序

更新日期：每月更新，采销可提供词表

京东, 搜索引擎, 爬虫, 索引, 搜索词处理

本版禁止留QQ/微信等联系方式（可发私信），禁止回复与主题无关内容，违者一律扣分禁言，欢迎右下方举报「举报有奖」

回复转播

回复

猜你喜欢

淘宝这种直通车打法真的好强，就一天给我增加到88单！

**** 本内容被作者隐藏 **** ...

蹲坑哲学家|2026-06-17| 阅读 161|评论 16
电商新手必懂：全标题半标题精准长尾词定义与用法

突然发现，有些淘宝商家连基本的关键词都不会玩。全标题、半标题、精准长尾词、精准词和大词，到底是什么词？很多商家问新品刚上架以后怎么补单，我应该选什么样的词去做？补单关键词主要是全标题、半标题、精准长尾词、精准词和大词。那这些词到底是什么样的词？虽然 ...

zhaoqiaoqian|2026-06-17| 阅读 89|评论 3
淘宝新品28天起爆流程与各阶段操作重点

先搞懂：平台给你的28天，到底在考什么？很多人以为新品上架，平台会直接给大流量——错！这28天是平台的「试探期」，就像HR招人的试用期，通过阶段性考核，才会给你更多资源。核心逻辑就一个：你能不能把流量用明白。能就流量翻倍；不能，直接把你从流量池里踢出去 ...

hot|2026-06-18| 阅读 53|评论 6
2026年最新单品爆款周期性运营推广流程

我们现在做店都是全店爆款打造思路或者全店矩阵打品思路，如果你还没有打法思路，那你今天可以学习一下，今天赤壁哥的内容是关于单品爆款周期性运营推广流程，也就是说，从刚开始你做完产品内功，上架链接，选择推广的计划，包括渠道，首先就是产品的基础成交期——中后 ...

火烧赤壁|2026-06-03| 阅读 202|评论 0
【运营的自我修养】2026年淘系整套运营系列（连载三）

大家好，我是赤总，2026年了，没有以前那种激情的电商氛围了，都只忙自己的店铺，物是人非。今天我给大家分享的一整套系列玩法，适用于所有类目，尤其是标品类目，如果你们有做标品类目的，一定要认真的看我这一整套运营流程，从一开始通过生意参谋分析一些行业的一些 ...

火烧赤壁|2026-06-14| 阅读 202|评论 0
每天几十张商品图要处理，我用这套方法从2小时缩到20分钟

做女装三年了，从最开始啥也不会，到后面专门招美工，现在又回到自己动手。不是美工不好用，是沟通成本太高。一张图来来回回改三四次，等她排期做完，平台流量高峰期都过了。后来逼着自己找方法，试了一圈工具，现在总算有一套稳定的流程。今天纯分享，不废话，直接上 ...

抠图123|2026-06-18| 阅读 0|评论 0
很多淘宝新店没访客、没流量，不是产品不行，是标题写错了！

很多淘宝新店没访客、没流量，不是产品不行，是标题写错了！乱堆砌关键词、跟风抄同行、字数凑数直接导致：搜索不到、权重不涨、永远没自然流量分享一套我们代运营一直在用的「万能标题公式』，新手套用即可，快速拉高搜索曝光淘宝黄金标题结构（30字满字利用） ...

hansha|2026-06-18| 阅读 0|评论 0
拼多多改版后怎么报活动

拼多多大变天了，看图洗完链接不能直接去到大促了，有的甚至需要等待72个小时。如果你的店铺被比价了，千万不要去洗你的老链接，洗完会直接断流。如果被比价了，我们只需要去报名：21593、21408、20303，流量就能恢复。 ...

如果爱|2026-06-18| 阅读 0|评论 0
拼多多活动比价解决方法

做拼多多最怕活动上得好好的，突然被系统比价。平台让你降价，不同意就断流，下资源位。同意降价，自己就要亏本。那到底怎么办？一分钟给你们讲明白，操作其实非常简单。首先，打开营销活动，找到活动ID 21824，这个是可以原价直接报名的。 **** 本内容被作者隐藏 *** ...

`Demon|2026-05-28| 阅读 337|评论 19
【运营的自我修养】市场分析属性风格容量大小以竞品竞店数据分析（连载二）

大家好，我是赤总，咱们今天也来聊一聊基础的数据分析，哈哈。一、市场分析属性风格容量大小以及类目销量瓶颈我们在操作不同类目产品的时候，往往会形成一种数据对比思维，为什么A类目月销能做到1000，B类目一样的布局策略只能做到500，以及为什么A类目一样的操作策略 ...

火烧赤壁|2026-06-08| 阅读 202|评论 0

帽子

四钻会员

25 主题	253 回帖	1066 积分

+ 关注发消息

京东搜索引擎原理

回复

相关帖子

浏览过的版块