互联网社区产品方法论(15)

2023-05-03 来源:飞速影视
就目前情况而言,机器还是不能替代人工,原因也很简单,就是机器并没有大家想的那么智能,就像Siri这种顶尖的人工智能机器人,如果你问的问题稍稍跳脱它给出的范围,它的“智商”就会断崖式下降,只会跟个二傻子一样讲冷笑话。
就之前了解到的情况来看,目前涉及UGC的公司,基本还都是使用人工来对内容审核。机器现在做的,更多的是第一步的关键词过滤,如提到某些关键词,内容就一定违规,机器做的就是将这些内容直接过滤掉,不用再走到人工那一步。
对于内容审核流程来说,必需的有以下三个环节,分别是:机器审核、人工审核、人工质检。
机器审核如上所述,主要作用为关键词过滤,过滤掉100%违规的帖子,减少人工审核的工作量;次要作用为内容打标(视频审核的话,机器还会对视频进行随机截帧),标签的维度多种多样,目标始终是围绕着提升人工审核的效率。
内容到达人工审核这一步时,审核人员看到的,已经是机器处理过的内容。审核人员通过浏览原始内容和机器给的辅助判断信息,迅速对内容合规性作出判断。人工审核难免出现误差,因此,一般社区还会增加质检,即随机抽取已审核内容进行再次审核,确保内容的合规性。
5. 内容消费
用户在社区内消费的内容,按照内容分发逻辑来看,主要分为3类:话题信息流,关注信息流,以及推荐信息流。
1)话题信息流
是以话题聚合的内容列表,如某个豆瓣小组的帖子列表。话题信息流排序方式较为简单,不外乎最新发帖序、最新更新/评论序,以及热门序。
前两个比较容易理解,热门序是通过热度算法,将近期热门帖子筛选出来,并以热度值进行排序的排序方式。可能有人好奇具体的热门算法,其实业内普遍使用的都是“热度值=(初始热度值 互动热度值)*时间衰减因子”的公式。
更具体的举例来说,可以将上述公式细化为:热度值=(初始热度值 (阅读量*x 转发量*y 分享量*z 评论量*a 点赞量*b 收藏率*c 触发关注量*d 作者个人主页打开量*e))/(e^(k*(t1-t0))),其中,“初始热度值”和作者属性、内容属性以及实体属性相关,“(e^(k*(t1-t0)))”是基于牛顿冷却定律的时间衰减因子。
2)关注信息流
是用户关注的人发布信息组成的内容列表,关注是用户主动触发的行为,理论上关注信息流中的所有信息,用户都想要阅读。因此,早期关注信息流均是以最近发布时间进行排序。
相关影视
合作伙伴
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)

www.fs94.org-飞速影视 粤ICP备74369512号