亚马逊A9算法很奥秘,围观机器学习怎样测试它
作者头像
  • 周鸿祎的铁杆粉丝
  • 2019-11-08 14:17:41 7

亚马逊的A9算法最近有所调整,但亚马逊并未公开影响算法的具体因素。自10月底以来,卖家们越来越感受到这种变化的影响,不仅是中国卖家,外国卖家也感受到了这一点。因此,有国外的研究人员利用机器学习技术来预测影响搜索排名的因素。

根据数据情报公司Jumpshot的报告显示,在亚马逊上进行产品搜索的用户比在谷歌上更多。此外,亚马逊90%的产品浏览量来自其有机搜索,而非广告或外部渠道。亚马逊搜索引擎的目标是根据产品的销售潜力对其进行排名。影响销售的因素有很多,例如价格、评价和产品页面的内容。那些在这几个方面表现优异的产品往往会获得更高的排名。

然而,很难确定这些因素的重要性,特别是在亚马逊未公开披露这些因素的情况下。

预测产品的销售潜力

研究人员注意到,在多个关键类别中,如电子产品和汽车类产品,最畅销的产品往往拥有最多的评价。消费者在购买前会留下评价,这引发了人们对于评价数量是否能反映产品销售潜力的疑问。为了验证这一点,研究人员使用了机器学习技术进行测试。机器学习不仅能生成预测,还能通过创建模型来识别哪些特征对预测最为关键。

研究人员进行了以下步骤的测试:

  1. 准备一个包含评价数据的机器学习源文件;
  2. 使用谷歌的自然语言处理API对源文件中的评价进行情感分析;
  3. 将处理后的文件上传至BigML,这是一个易于使用的机器学习平台;
  4. 利用深度神经网络模型(模拟人脑识别模式)预测数据集中评价的数量;
  5. 分析影响模型预测结果的关键特征,这些特征对增加评价和促进销售至关重要。

数据源

研究人员从亚马逊智能工具JungleScout获取了2017年第四季度的畅销产品名单,这份名单包含了约10000种不同类别的产品,研究人员主要关注“汽车”类目。

数据集包括15列,如亚马逊标准标识号(ASIN)、产品子类别、产品名称等。研究人员还试图提取产品评价文本,并进行情感分析,以判断其是否具有预测价值。他们从相关专业人士那里获取了汽车评价数据,并进行了测试。

最终数据集包含以下列:

  • ASIN(亚马逊标准标识号)
  • 子类别
  • 产品编号
  • UPC1
  • 产品名称
  • 品牌名称
  • 平均评分
  • 评价数量
  • 是否有FBA服务
  • 是否有零售服务
  • 总报价数
  • 最低价格
  • 最高价格
  • 第三方最低价格
  • 第三方最高价格

接下来,研究人员利用谷歌的自然语言处理API来捕捉评价的情感。经过处理,数据集中新增了四个情感字段:明确积极、明确消极、中性和混合情绪。每个字段包含“文档得分”、“文档大小”和“得分最高的句子”。

评价的情感分析

经过处理的数据集新增了情感字段,包括明确积极、明确消极、中性和混合情绪。每个字段包含“文档得分”、“文档大小”和“得分最高的句子”。这些字段有助于进一步分析哪些因素最具预测性。

运用BigML进行机器学习

研究人员选择了评价数量作为预测目标,并决定使用深度神经网络作为机器学习模型。BigML尝试了128个不同的模型组合,以找到最佳的模型。

结果显示,子类别(86.73%)、产品编号(9.6%)、产品名称(3.49%)、总报价数(0.06%)、UPC1(0.04%)、平均评分(0.03%)、最高价格(0.02%)和最低价格(0.01%)是影响销售的主要因素。

令人意外的是,评价的情感没有任何影响,而平均评分和价格几乎没有什么预测效果。

结论

可以看出,产品类别和产品名称的选择可能对销售产生重大影响,因为某些产品和类别本身就有较高的需求。此外,产品数量也是一个重要的预测因素。从这次测试结果来看,搜索排名与评价的好坏并没有太大关系。不知道各位卖家对此有何看法。

    本文来源:图灵汇
责任编辑: : 周鸿祎的铁杆粉丝
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
亚马逊围观奥秘算法机器怎样测试学习
    下一篇