淘宝天猫 火...

从卖家角度细说淘宝的降权判定系统

6950 33
2013-10-4 13:09:15 发表在 卖家交流| 查看全部 阅读模式

淘宝二代稽查系统,这个马云号称投资2个亿其实是购买雅虎搜索引擎技术然后阿里二次开发整合的。至于雅虎的技术,当时号称世界第一,其实也不然,后来雅虎的不景气,直接影响到在搜索研发这块的继续投资,以至于使他的技术停歇,而且面对谷歌的不断更新的Google Spider,雅虎因此早已也沦为非尖端前列了。背景就不详细论述了,下面进入正题。

从你打开淘宝那一刻到看到订单成功页面时,在前端和后台就经历了很多个技术架构了,也就是说你每打开一个URL页面或者一个点击按钮,都会经过各种数据上传和反馈加后台系统分析,这里说两个比较典型的。

假如你在商品搜索:搜索引擎技术+商品ID权重方案+恶意点击技术+前端展示模块

假如你在订单支付:交易引擎清算系统+支付宝智能实时风险监控系统+通信前置+银行网关

重点说这二代稽查系统,先以技术概念方面说说这项系统与我们卖家非常相关的重要组成部分:

CTU(支付宝智能实时风险监控系统)

pmcots系统(防恶意点击系统)

特征索引数据库

数据检索系统

结果判定

………………

当然还有其他架构组成,我们的主题是淘宝卖家运营,先了解相关我们的,这里先不探讨其他的。

大家可能听见这些概念感觉一头雾水,非常乏味,不知所云。如果你是淘宝中小卖家,这些都与你息息相关,是你必须要知道的知识。下面我就以淘宝卖家的角度来解析这些技术原理和相应应对手段。概念就不讲了,想了解概念的大家可以使用下度娘。

CTU:智能实时风险监控系统,这个系统最初是由支付宝自主研发的智能实时风险监控系统,现在作安全系统CTU在各大消费购物网站的应用已经很普及了。由支付宝自主研发

,并不断优化升级,是目前国内最先进的网上支付风险实时监控系统之一。该系统是支付宝风险管理的一个核心系统,能通过数据分析丶数据挖掘进行规则自学习,自动更新完善风险监控策略。CTU系统基于用户行为来判断风险等级,集风险分析丶预警丶控制为一体。并配备风险稽核专家小组进行风险稽查及处置。这个系统可以实现7*24小时全天候风险监控,监控内容包括:账户风险监控丶交易风险监控丶反洗钱监控丶反盗卡监控丶反套现监控丶商户违规监控。

其中与我们最相关的就是账户风险控制和违规控制了,大家一定会问,怎么去规避这个系统呢?账户风险是购买ID,不可空因素过多,透露一点不要去加载他的主要可执行控件EXE,前几天一个朋友说通过插件获取底层信息不现实,那我告诉你,通过EXE获取你的底层信息那时轻而易举,什么是EXE?哎呀这个懂得人自然懂了!如果你在大量炒作过程经历了这个CTU,数据那是绝对有问题的。有朋友会说不安装控件有办法支付宝付款吗?答案是有的,只加载DLL吧,怎么加载?要不要我直接告诉你怎么赚钱?

pmcots系统:防恶意点击系统,其中包网络技术识别有:

1丶IP防止作弊,这个大家都懂。不解释。

2丶Netclean防止作弊,当你访问过一个页面时,Netclean并会记录,当你下一次访问该页面时,并会提交一个相同COOKIES参数,可以判断重复的参数。这个就是为什么SD要清理缓存的原因了。

3丶点击比率,这个大家也懂,重要是点击数据被收入了特征索引库。

4丶ALEXA数据,这里用流量精灵刷流量的人大概深有体会。

5丶来源统计,我们在量子统计里面就能看到这些信息

6丶唯一参数,这个需要调用很多参数,例如大家知道的MAC,硬盘序列号,浏览器版本,系统UI等。有一些唯一参数在WEB上很难做到获取,不是技术实现部了,因为这样太危险了,HTTP的协议权限要求太高,会造成整个PC数据暴露在外,就是有些朋友说的浏览个淘宝网页就能把我的系统安装时间,浏览器版本号什么读取出来?其实不是,是调用了系统的数据,如前面的CTU,知道关联什么了吧?

7丶点击时间时间顺差,打开一个页面,二次点击是否为瞬间?因为每个页面都由印象转变为关注,再转变成点击行动,当你打开一个前端页面,一定时间参数内立即关闭,也可以判断为无效点击。没错,淘宝就是根据这个特征识别是否为机器人或者故意点击的。至于菜鸟卖家,怎么检验?这个我们可以才量子记录浏览深度和直通车过滤里面检验数据。也就是大家互刷为什么要深度浏览这样了。这个大家都做淘宝大家都懂。

8丶鼠标值,显示屏幕上的每个点都具有一个坐标值,当你在某个点按下鼠标时,都会有一个坐标值,当采用机器人点击时,为同一个鼠标值,可以只记一次点击。每次点击都会产生鼠标的KEYUP 和KEYDOWN的行为,如果未能捕获到这个值,可能是模拟数据提交。又有菜鸟卖家会问?啥?机器人点淘宝,不会吧??为避免误解,科普一下,我们把系统或者软件也可以比喻成机器人。例如大家知道的刷/信誉软件。

再跟大家补充一下这个系统我们运营过程遇到的各种触发条件(何为触发条件?就是你做了什么动作为条件,系统会检验什么信息):磁盘底层信息(实名认证和安装数字证书和安装支付宝安全控件读取调用,能够读取的我们知道的有旺旺客户端,支付宝安全控件,数字证书等),网卡mac,浏览器和系统UI(https数据传输调用,通俗地说就是我们打来淘宝界面就调用了进行比对了,就是我们知道的浏览器COOKIE,这个技术在WEB已经运用的很成熟了,大家无需多疑,呵呵)。

特征索引数据库:收集到的信息进行整理丶分类丶索引以产生索引库。按照一定方式有序编排起来,以供检索的数据库。我们可以叫做此系统是不断收集和更新数据的学习型病毒积累系统,里面包含了大量数据,经过大量订单交易订单步骤轨迹数据的收集,分析比对,集合信息,就像我们日常配货一样先把货集合好,建立多个特征信息库。就是我们经常听到的数据纬度,里面有多少纬度就是商业机密,然后交给下面说的检索系统调用此数据库的数据纬度。我们每生成一个订单,就会生成各种数据进入这个系统供检索和分析。

数据检索系统data retrieva:从索引数据库或存储中查找和选取所需数据的过程。淘宝有千千万万个订单,每一个订单号都需要经过这个系统分析比对,其中调用了哪些数据我们估计在运营或者炒作过程中也得出了一些经验,没错,罪魁祸首就是他读取了你能想到的一些信息,我在这里举几个例子开发模型,大家可以举一反三:

1丶淘宝静默转化数据纬度比对

旺旺在线聊天:如系统设定无聊天为w ,手机旺旺为WW,旺信为WWW,网页旺旺为WWWW 检索系统则调用特征索引数据库数据分析交易数据的其中一个纬度比对:

例女装类目交易订单中此纬度正常百分比【特征索引数据库数据】:

WW>15%

www>0.15%

wwww>2%

淘宝商品ID123456  交易订单1丶2丶3丶4丶5-100个订单【我们知道销量数100个订单中】ww<15% 纬度异常,判定降权。反之亦然。   

2丶购买旺旺信誉度纬度比对

设置购买旺旺信誉度0=w 1心=ww 2心=www…………如此类推

纬度判定指标为

订单中此纬度正常百分比【特征索引数据库数据】:

w<60%

ww<40%

www<30

淘宝商品ID123456  交易订单1丶2丶3丶4丶5-100个订单【我们知道销量数100个订单中】ww>60% 纬度异常,判定降权。反之亦然。

以上纬度为虚拟数据,别对号入座,是为举例说明,大家经过各种降权苦逼后应该都知道很多纬度,这个我们可以后期在探讨再分享。

每个数据比对后都会进入最终判定,大家都应该知道的是,如单一纬度异常,就是判定疑似虚假交易,可申诉,申诉后进入人工判定(淘宝为了节省人力,你不申诉就不人工了,默认系统判定)。如果系统检测多个纬度异常,就是虚假交易,哈哈,还是为了节省人力资源,自动关闭申诉接口。就是大家听到客服说的不允许申诉了。如果你恶意申诉,后果严重哦。

如果你看不懂上面的,这里通俗地说我们知道的后台计算流程,用通俗语言大概可以这样理解:

判断点击过滤(pmcots) > 判断交易(ctu) > 检索订单数据(数据检索) > 结果判定

再说几个日常比较典型的,支付宝账户关联,支付宝系统在安全方面银行交易系统利用SSH框架做的https+数字证书,这个之记录硬件和加密数据传输,不存在账户关联,至少系统不会去检测,(进入人工判定不知道)。比如说SD返款,用其他支付宝返款之类的云云,无非也是自我安慰而已。

再说一下物流单号,淘宝其实有两个物流公司接口,一个是客户端物流显示系统,就是我们看到的前端物流信息,如果进入人工判定,还有一个是物流公司开放给淘宝的一个内部API接口,此物流信息和物流网点的内部系统显示的物流信息一致,比客户端的更及时,更详细。这个系统虽然把物流系统作了一个纬度判定,但是因为在技术上的原因,并不能以匹配物流指标的字符串是否相符合为系统自检测判定指标,因为访问量大,需要匹配的字符串太多,数据运算压力大。但是重复的物流单号和时间匹配是有存在的,淘宝今年更新了前端拦截技术,把重复使用过的物流单号拦截在前端提示,可是由于数据库的更新和传输延迟,有一定比例的拦截失败,到了物流判定,一般是人工检测是否恶意使用虚假单号了。

关于申诉,订单申诉的都是随机抽取(可能其中只有一个订单进入了判定异常),大家不要纠结为什么是这5个。

全部评论33

沙发 2013-10-10 15:23:06 | 查看全部
或许我们不应该把刷/销量研究得那么复杂,要看的简单化一些吧
3楼 2013-10-10 15:34:23 | 查看全部
这个不错,学习。
4楼 2013-10-10 16:41:01 | 查看全部
好复杂啊,不过也蛮有道理……
5楼 2013-10-10 16:49:33 | 查看全部
没这么多事,想多了
6楼 2013-10-10 17:52:48 | 查看全部
多谢分享,学习了
7楼 2013-10-11 09:27:25 | 查看全部
这个太深奥了,简化一下就好了
8楼 2013-10-11 10:24:16 | 查看全部
如果真这样SD那不是非常非常难
9楼 2013-10-11 10:37:09 | 查看全部
好深奥看不懂
10楼 2013-10-11 22:28:38 | 查看全部
好复杂的说
11楼 2013-10-12 12:24:51 | 查看全部
这个讲的好专业,看懂不少,学习了
12楼 2013-10-13 11:02:55 | 查看全部
谢谢楼主分享~!!!!!!!!!!
13楼 2013-10-13 14:35:27 | 查看全部
嗯,还行,不错
14楼 2013-10-13 14:49:07 | 查看全部
这些看得我一头雾水……太深了
15楼 2013-10-13 15:01:18 | 查看全部
多余了 吧 ~~~~~~~~那些秒刷 不死的 怎么解释
123下一页

回复

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

猜你喜欢
  • 淘宝这种直通车打法真的好强,就一天给我增加到88单!
    **** 本内容被作者隐藏 **** ...
    蹲坑哲学家|2026-06-17| 阅读 161|评论 16
  • 电商新手必懂:全标题半标题精准长尾词定义与用法
    突然发现,有些淘宝商家连基本的关键词都不会玩。全标题、半标题、精准长尾词、精准词和大词,到底是什么词? 很多商家问新品刚上架以后怎么补单,我应该选什么样的词去做?补单关键词主要是全标题、半标题、精准长尾词、精准词和大词。那这些词到底是什么样的词?虽然 ...
    zhaoqiaoqian|2026-06-17| 阅读 89|评论 3
  • 淘宝新品28天起爆流程与各阶段操作重点
    先搞懂:平台给你的28天,到底在考什么? 很多人以为新品上架,平台会直接给大流量——错!这28天是平台的「试探期」,就像HR招人的试用期,通过阶段性考核,才会给你更多资源。 核心逻辑就一个:你能不能把流量用明白。能就流量翻倍;不能,直接把你从流量池里踢出去 ...
    hot|2026-06-18| 阅读 53|评论 6
  • 2026年最新单品爆款周期性运营推广流程
    我们现在做店都是全店爆款打造思路或者全店矩阵打品思路,如果你还没有打法思路,那你今天可以学习一下,今天赤壁哥的内容是关于单品爆款周期性运营推广流程,也就是说,从刚开始你做完产品内功,上架链接,选择推广的计划,包括渠道,首先就是产品的基础成交期——中后 ...
    火烧赤壁|2026-06-03| 阅读 202|评论 0
  • 【运营的自我修养】2026年淘系整套运营系列(连载三)
    大家好,我是赤总,2026年了,没有以前那种激情的电商氛围了,都只忙自己的店铺,物是人非。 今天我给大家分享的一整套系列玩法,适用于所有类目,尤其是标品类目,如果你们有做标品类目的,一定要认真的看我这一整套运营流程,从一开始通过生意参谋分析一些行业的一些 ...
    火烧赤壁|2026-06-14| 阅读 202|评论 0
  • 每天几十张商品图要处理,我用这套方法从2小时缩到20分钟
    做女装三年了,从最开始啥也不会,到后面专门招美工,现在又回到自己动手。 不是美工不好用,是沟通成本太高。一张图来来回回改三四次,等她排期做完,平台流量高峰期都过了。 后来逼着自己找方法,试了一圈工具,现在总算有一套稳定的流程。今天纯分享,不废话,直接上 ...
    抠图123|2026-06-18| 阅读 0|评论 0
  • 很多淘宝新店没访客、没流量,不是产品不行,是标题写错了!
    很多淘宝新店没访客、没流量,不是产品不行,是标题写错了! 乱堆砌关键词、跟风抄同行、字数凑数 直接导致:搜索不到、权重不涨、永远没自然流量 分享一套我们代运营一直在用的「万能标题公式』,新手套用即可,快速拉高搜索曝光 淘宝黄金标题结构(30字满字利用) ...
    hansha|2026-06-18| 阅读 0|评论 0
  • 拼多多改版后怎么报活动
    拼多多大变天了,看图 洗完链接不能直接去到大促了,有的甚至需要等待72个小时。如果你的店铺被比价了,千万不要去洗你的老链接,洗完会直接断流。如果被比价了,我们只需要去报名:21593、21408、20303,流量就能恢复。 ...
    如果爱|2026-06-18| 阅读 0|评论 0
  • 拼多多活动比价解决方法
    做拼多多最怕活动上得好好的,突然被系统比价。平台让你降价,不同意就断流,下资源位。同意降价,自己就要亏本。那到底怎么办?一分钟给你们讲明白,操作其实非常简单。 首先,打开营销活动,找到活动ID 21824,这个是可以原价直接报名的。 **** 本内容被作者隐藏 *** ...
    `Demon|2026-05-28| 阅读 337|评论 19
  • 【运营的自我修养】市场分析属性风格容量大小以竞品竞店数据分析(连载二)
    大家好,我是赤总,咱们今天也来聊一聊基础的数据分析,哈哈。 一、市场分析属性风格容量大小以及类目销量瓶颈 我们在操作不同类目产品的时候,往往会形成一种数据对比思维,为什么A类目月销能做到1000,B类目一样的布局策略只能做到500,以及为什么A类目一样的操作策略 ...
    火烧赤壁|2026-06-08| 阅读 202|评论 0
热帖推荐换一批
关灯 在本版发帖 返回顶部
快速回复 返回顶部 返回列表