-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathRecModel.drawio
22 lines (22 loc) · 7.79 KB
/
RecModel.drawio
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
<mxfile host="app.diagrams.net" agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36 Edg/127.0.0.0" version="24.7.6">
<diagram name="第 1 页" id="UGm5JvRGFB_UD_Ni14SP">
<mxGraphModel dx="1460" dy="377" grid="1" gridSize="10" guides="1" tooltips="1" connect="1" arrows="1" fold="1" page="0" pageScale="1" pageWidth="827" pageHeight="1169" math="0" shadow="0">
<root>
<mxCell id="0" />
<mxCell id="1" parent="0" />
<mxCell id="qLKPpFvlpWNobKLwXuhB-1" value="<b>FM 因子分解机</b><br><div>1)考虑一阶特征权重和,二阶权重和(为特征分配隐向量,通过内积计算权重),最后逻辑回归得到结果</div><div>2)</div><div><br></div><div><br></div><div><b>FM 域因子分解机</b><br></div><div>1)特征与不同特征交互时,应该有不同的表示,引入域的概念(一个特征有多个隐向量,针对不同域不同)<b><br></b></div><div>2)</div><div><br></div><div><br></div><div><b>DeepFM&nbsp;</b><br></div><div>1)所有特征经过线性层<b><br></b></div><div>2)稀疏特征经过FM层</div><div>3)所有特征经过DNN层</div><div>4)最后加和后经过sigmod输出概率</div>" style="rounded=0;whiteSpace=wrap;html=1;align=left;verticalAlign=top;spacingLeft=4;" parent="1" vertex="1">
<mxGeometry x="-440" y="50" width="620" height="250" as="geometry" />
</mxCell>
<mxCell id="10POJ0Ot5cjL5zv7g6nm-1" value="<b>Rank 精排</b><div><b><font color="#9933ff">传统机器学习推荐模型</font><br></b><div>1)FM 模型</div><div>解决稀疏特征数据的处理难点,引入了二阶特征组合</div><div><br></div><div>2)FFM模型</div><div>引入了域的概念,提高了模型的表达能力</div><div>但是增加了模型参数量与复杂度,增加了计算开销</div><div><br></div><div>3)GBDT+LR&nbsp; (特征工程模型化)</div><div>利用GBDT筛选出特征组合,再输入LR进行预测,能够利用高阶关系</div><div>缺点为无法进行在线学习。需要提前进行GBDT的训练与特征组合提取</div><div><font color="#0066cc">Facebook的经验:低频更新embedding网络,高频更新上层网络结构</font></div><div><br></div><div>4)MLR&nbsp; (分组+聚合)</div></div>" style="rounded=0;whiteSpace=wrap;html=1;align=left;verticalAlign=top;spacingLeft=4;" vertex="1" parent="1">
<mxGeometry x="200" y="50" width="630" height="250" as="geometry" />
</mxCell>
<mxCell id="10POJ0Ot5cjL5zv7g6nm-2" value="<div><b><font color="#000099">经过特征工程提前到了有效的特征,随后使用特征结合这些模型进行预测任务</font></b></div><div><b>WDL<span style="white-space: pre;">	</span><span style="white-space: pre;">	Wide Deep Learning</span></b></div><div style=""><font color="#009900">Wide部分</font>对特征进行LR,<font color="#009900">Deep部分</font>则直接将特征输入神经网络,两边输出加权求和并经过sigmod作为预测结果</div><div style=""><br></div><b>DCN<span style="white-space: pre;">	</span><span style="white-space: pre;">	</span>Deep Cross Network</b><br><div>DCN使用<font color="#009900">Cross网络</font>替代WDL的LR网络,<span style="background-color: initial;">使用<font color="#009900">多层交叉层</font>对输入特征进行交叉,</span><span style="background-color: initial;">增加了特征之间的交互力度</span></div><div><font color="#808080">(每一层的计算过程是:特征乘以x0转置乘权重向量,加上偏置)</font></div><div><font color="#808080">(是先将稀疏特征embedding后再输入两个网络的,是的,两边都是网络)</font></div><div><br></div><div><b>DeepFM<span style="white-space: pre;">	</span><span style="white-space: pre;">	</span></b><b style="background-color: initial;">Deep Factorization Machine</b></div><div>DeepFM则使用FM代替WDL的LR网络,</div><div><br></div><div><br></div><div><b>BST<span style="white-space: pre;">	</span><span style="white-space: pre;">	</span><span style="white-space: pre;">	</span>B</b></div><div><br></div>" style="rounded=0;whiteSpace=wrap;html=1;align=left;verticalAlign=top;spacingLeft=4;" vertex="1" parent="1">
<mxGeometry x="-440" y="320" width="620" height="380" as="geometry" />
</mxCell>
<mxCell id="10POJ0Ot5cjL5zv7g6nm-4" value="<div><div><b style="background-color: initial;"><font color="#9933ff">深度学习推荐模型</font></b><br></div><div>1)WDL&nbsp; (Wide &amp; Deep Learning)</div></div><div>Wide 用于记忆,Deep 用于泛化</div><div>两个结构的优化器不一样,Wide采样FTLR(处理稀疏性),Deep采用AdaGrad</div><div><br></div><div>2)DCN&nbsp; &nbsp; (Deep&amp;Cross Network)</div><div>将WDL模型的Wide部分替换为Cross网络,加强了特征信息的融合</div><div>Cross网络使用层层传递的形式,和零层相乘再乘以参数向量,加上偏置与残差</div><div><br></div><div>DCNv2 两种结构 stacked 与 parallel,好坏需要具体场景分析</div><div>改进分为两个方面:1)Cross网络的权重向量变为矩阵,表达能力变强;2)加入了MOE层</div><div><br></div><div>3)DIN&nbsp; &nbsp; &nbsp; (Deep Interest Network)</div><div>用户的兴趣embedding通过历史列表计算,为静态的,然而面对不同候选物品</div><div>可以利用注意力机制动态编码用户向量,表现为对不同物体,兴趣应该是动态的</div><div>动态embedding</div><div><br></div><div>4)DIEN&nbsp;</div><div>对序列数据进行建模,引入了GRU计算用户的兴趣趋势</div><div><br></div><div>5)BST&nbsp;<span style="white-space: pre;">	</span><span style="background-color: initial;">Behavior Sequence Transformer</span></div><div><span style="background-color: initial;"><br></span></div>" style="rounded=0;whiteSpace=wrap;html=1;align=left;verticalAlign=top;spacingLeft=4;" vertex="1" parent="1">
<mxGeometry x="200" y="320" width="630" height="380" as="geometry" />
</mxCell>
</root>
</mxGraphModel>
</diagram>
</mxfile>