首 页
·
国外客户开发
·
操作流程
·
常见问题
·
邮件群发软件
·
与其他软件对比
·
数据挖掘基础知识
·
联系我们
在线客服
QQ :
QQ :
外贸营销服务方案
主动搜索国外买家,轻松搞定,低成本、高效率,给外贸企业全球客户的联系方式,带来B2B上找不到的大客户和高利润
联系方式
客服电话:027-68766423
QQ
:3057296586,3057213126
常见问题 :如何确保提交给用户的数据的精确性?
在第一个“如何保证能找到95%以上国外潜在客户”问题中, 我们谈到用大数量的关键词与特征去搜索,这必然会导致搜
索出的原始数据包含量大量非潜在客户的数据,如何去掉这些不需要的数据,只保留我们需要的潜在客户数据呢?
第一步
,进行简单的筛选工作,如去掉重复网址,blgo类,黄页类 .gov类,及明显不是潜在客户的网址。
第二步
,进行精确的数据匹配处理,筛选出潜在客户的网址,这一步是我们处理工作的重点。
我们采取数据匹配方法,是一种软件智能学习的方法,它通过已分类的潜在客户文本的样本集,做为样品训练集,
通过软件自动学习,来断定未知数据文本是否属于样本集一类,或不属于样品集一类,从而找出正确的结果。
过程描述如下:
特征向量提取与降维方法:采用三种方法,TF-IDF,互信息(Mutual Information)与x2统计法(卡方CHI)。识别算
法也采用三种,朴素贝叶斯、随机森林与改进的近邻分类(KNN), 共9次不同特征提取与分类识别算法的扫描,极
大地提高了分类识别的精度。根据语言种类,生成多达76种语言的特征向量与训练样本集,更是进一步地提高了
识别精度.
软件自动识别的中间结果数据精确度可到85%以上. 且这个精确度不受关键词数量与关键词长短的影响.
这个中间结果提交给用户,进行简单的人工识别后,即可达到100%的精确度
:
关于本站
|
联系我们
| 服务体系 | 网站地图
Copyright © 2012-2018 All Rights Reserved.
Email:henyuan@163.com