首  页 · 国外客户开发 ·操作流程 ·常见问题 ·邮件群发软件 ·与其他软件对比· 数据挖掘基础知识 · 联系我们
在线客服
QQ : 点击这里给我发消息  
QQ : 点击这里给我发消息

 

 
 
外贸营销服务方案
主动搜索国外买家,轻松搞定,低成本、高效率,给外贸企业全球客户的联系方式,带来B2B上找不到的大客户和高利润 
联系方式
 
客服电话:027-68766423
QQ :3057296586,3057213126

 
 
 
 
  
 常见问题 :如何确保提交给用户的数据的精确性?
  

   在第一个“如何保证能找到95%以上国外潜在客户”问题中, 我们谈到用大数量的关键词与特征去搜索,这必然会导致搜

   索出的原始数据包含量大量非潜在客户的数据,如何去掉这些不需要的数据,只保留我们需要的潜在客户数据呢?

 
第一步,进行简单的筛选工作,如去掉重复网址,blgo类,黄页类 .gov类,及明显不是潜在客户的网址。

 
第二步,进行精确的数据匹配处理,筛选出潜在客户的网址,这一步是我们处理工作的重点。

         我们采取数据匹配方法,是一种软件智能学习的方法,它通过已分类的潜在客户文本的样本集,做为样品训练集,

     通过软件自动学习,来断定未知数据文本是否属于样本集一类,或不属于样品集一类,从而找出正确的结果。

          过程描述如下:

          特征向量提取与降维方法:采用三种方法,TF-IDF,互信息(Mutual Information)与x2统计法(卡方CHI)。识别算

          法也采用三种,朴素贝叶斯、随机森林与改进的近邻分类(KNN), 共9次不同特征提取与分类识别算法的扫描,极

          大地提高了分类识别的精度。根据语言种类,生成多达76种语言的特征向量与训练样本集,更是进一步地提高了

          识别精度.

          软件自动识别的中间结果数据精确度可到85%以上. 且这个精确度不受关键词数量与关键词长短的影响.
            
          这个中间结果提交给用户,进行简单的人工识别后,即可达到100%的精确度


 
 
 

 

   


 
:
关于本站 | 联系我们 | 服务体系 | 网站地图
Copyright © 2012-2018 All Rights Reserved.
  Email:henyuan@163.com