当前位置：首页 > 资讯 >

ACL2020｜对抗式query-doc相关性模型，让线上搜索结果大幅提升！(2)

2023-05-01 来源:飞速影视

常见的其实就是两个思路：
前者是重表示学习，也就是我们常说的“endocer”，然后通过简单的方法计算他们的相似度（如余弦相似度）。最具有代表性的应该是DSSM[2]等双塔模型了。后者则重相似度计算，encode之后，通过句子之间的交互关系计算相似度，达成目标。常用的交互计算就是两个句子token间相互attention的过程，当然也有一些两者一起进入encoder共同计算的方法，比如BERT中的Text_a Text_b的训练方式，就是同时进行句内和句间的表示计算。虽然语义相似度问题已经有很多解决办法了，然而事实上，在应用过程中，相关性和相似度还是有着很大的差距，因为搜索内容的细微变化会带来较大的语义意图变化。比如用户想买“手机充电器”，但结果出了“手机壳”。虽然两者有一定的相似度，但明显是不相关的。
回过头来谈搜索广告，搜索广告是搜索中商（zhuan）业（qian）化的一环，希望的是能给到用户尽可能接触的东西尽可能相关，本来广告点的人就少，还无关就更凉凉了。
不慌，今天就介绍一个最新方法，来自亚马逊ACL20的《Learning Robust Models for e-Commerce Product Search》[3]，文章主要用在商品搜索的场景下，目的是判断query和item/doc之间的相关性。文中提出了一个与“对抗生成网络”类似结构的模型[4]，其中的判别器能够衡量query和doc之间的相关性，判断两者是否相关，生成器则能够生成与query相似却不相关的doc，借助类似对抗生成网络模式的训练，能够在较多噪音数据下，仍尽可能保证模型的鲁棒性。
2
模型
1、问题定义
为了更好的对模型进行描述，对问题进行定义，对一个匹配对，其中文档内容和对应的query ，表示两者的匹配情况，表示两者不匹配而表示两者匹配，而在建模过程中，会产生一个，当时会有。
2、模型架构
想要学东西，看论文肯定不能错过模型部分了。

1 2 3 4 5 ...9 查看全文

ACL2020｜对抗式query-doc相关性模型，让线上搜索结果大幅提升！(2)

搜索(2020)

如果不让上司注意到这个时间循环就无法结束

量产型璃子-模型女子的人生组装记-

量产型璃子-另一位模型女子的人生组装记-

沉船搜索者澳大利亚第一季

张慧仪的香港B级片，让你大饱眼福，面对三个变态歹徒她迎难而上

搜索

德国举行神秘仪式，恶魔之子降临人间，结果意外拯救世界成为英雄