当前技术:★★★★✰
未来潜⼒:★★✰✰✰
应⽤落地:★★★★✰
说到⼈⼯智能AI,可能很多⼈会想起来的就是推荐算法,毕竟电商是互联⽹时代的⼀个重要标志。推荐算法从AI算法层⾯来说技术含量不⾼,更花⼒⽓的也是后台数据库的建⽴。 推荐算法主要应⽤在两种地⽅,⼀种是购物,“猜你要买”,各类电商都是。⼀种是内容,“猜你喜欢”,今⽇头条,视频⽹站(优酷,抖⾳等),⾖瓣等都有。 推荐算法最初产⽣的原因⾮常直⽩,对电商来说就是希望⽤户够买更多的东西,对内容产⽣商来说希望你能在他们的⽹站逗留更长时间,可以完成他们⾃⼰定为KPI的东西,PV,留存率等。再某种意义上推荐合适的物品和内容帮助⽤户节约了时间,但是同时推荐算法也造成了信息过载。
常见推荐规则和算法
推荐算法最常见的是物品相似和⽤户共同喜好相似。
吸收二氧化硫
拿最初亚马逊卖书举例,物品相似就是如果你购买或者搜索了某⼀本书,它会根据之前提取的该书的特征,⽐如作者,图书分类,推荐同⼀作者或同⼀门类的其他图书给你。其实⼀个简单的基于规则推荐系统效果已经很惊艳了,⽽且这种推荐⼀般不会出来你完全不感兴趣的东西。
通过⽐较⽤户相似做的推荐就稍有趣⼀点,基本原理是A⽤户和B⽤户的购买记录和⾏为类似,归为同类客户,那么A⽤户记录⾥买过ab两本
书,B⽬前只买了a⼀本书,那系统就可能把b那本书也推荐B⽤户。这种规则能发现⼀些潜在的兴趣点,但由于分类的问题,也可能推荐出你完全不感兴趣的东西。
⽤户共同喜好原理的⼀个延申是⽤户画像。购物⽹站会记录⽤户的⼀系列⾏为形成数据链记录:登录,搜索、浏览、选择商品、页⾯停留时间、评论阅读、是否关注促销,以及加⼊购物车、下订单、付款、配送⽅式,最终是否有售后和返修。通过⾏为提炼或者通过三⽅数据库,年龄、性别、地域、购物习惯,是否已婚,是否有孩⼦,对促销是否敏感等都被记录在⽤户画像上。 早期的这两种⽅法实现都基于规则设置,做⼀些数据挖掘,根据挖掘结果设置⼀些规则。这些规则都是易于理解的,就像在书店,书会按照门类或者作者陈列。
推荐算法⾥还有⼀种思路接近搜索算法,根据⽤户搜索记录的关键字,推荐和这些关键字相关的其他搜索结果中的物品。
亚马逊率先推出协同过滤思想,之后电商都是采⽤⼏种算法共同作⽤的结果,除了以上三种,常见的还基于⼀些⽤户⾏为的假设,⽐如:
曾经浏览过但没有下单的物品
手机盒
按照周期性推荐,⽐如洗⾐粉,纸⼱等。
瘦肉精检测卡推荐⼀些卖得好的流⾏品
所以推荐算法和其他机器学习相关的算法不太⼀样,早期通过规则,⽤户⾏为研究等已经取得了不错的效果,机器学习时代带来了⼀些算法⼯具,⽐如使⽤Apriori和FP-Growth算法进⾏关联分析,但本质上的改变并不⼤,但因为机器学习算法能处理的数据量⼤⼤增加,对计算能⼒要求变⾼,所以在推荐算法领域也⼜很多关于⼤数据存储,离线计算,计算实时性等的技术领域。
virtualrouter
内容推荐算法的本质和电商推荐差不多,但内容推荐要考虑内容场景⾃⾝的特点,⽐如内容投票与等于电商的购买⾏为,但是也⼜可能⽤户不投票,那就要通过⽤户阅读/观看时长,是否转发等加权计算。另外内容⽣产商可能还知道⽤户的好友,可能通过⽤户的好友产⽣⼀些参考数据来推测你的喜好。
推荐算法的反思
推荐算法最有趣的地⽅是它的评价标准,商家致⼒于发现你的“潜在需求”,让你买更多东西,或者在内容⽹站上逗留更长时间。
⽽⼈最珍贵的⽣命,组成单位就是时间,从过好⾃⼰的⼈⽣的⾓度,就不应该放任⾃⼰的欲望,买太多东西,或者沉迷⼿机,这种被动接受连绵不
声波识别断的流式信息的⽅式使⼈容易丧失主动思考的能⼒,因为太多东西是“端”到⾯前的的⽽不是⼈主动寻的。
技术本性没有邪恶,了解推荐算法,主动把它当作⾃⼰的⼯具来⽤⽽不是被推荐算法牵着⽣活是⼈⽐较好的选择吧。
数码彩扩个⼈职业选择
推荐算法相关的职业还是相当多的,门槛也不⾼,可以作为其他⾏业进⼊AI⾏业的⼀个跳板,电商相关的容易进⼀些。如果真想在⼈⼯智能有所突破,最好还是选其他项⽬。