python矩阵分解原理是什么

本篇内容介绍了“python矩阵分解原理是什么”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

成都创新互联公司成立与2013年，先为龙文等服务建站，龙文等地企业，进行企业商务咨询服务。为龙文企业网站制作PC+手机+微官网三网同步一站式服务解决您的所有建站问题。

原理：矩阵分解

矩阵分解是推荐系统系列中的一种算法，顾名思义，就是将矩阵分解成两个（或多个）矩阵，它们相乘后得到原始矩阵。在推荐系统中，我们通常从用户与项目之间的交互/评分矩阵开始，矩阵分解算法会将用户和项目特征矩阵分解，这也称为嵌入。下面以电影推荐中的评分，购买等矩阵为例。

通常，在数据集中，要挖掘用户和项目属性的潜在特征。本质上，潜在特征是用户/项目在任意空间中的表示，表示用户如何评价电影。在电影推荐系统的示例中，一个用户样本中包含了他所观看的多个电影，潜在特征的值越高，则表示他喜欢该类型的电影，那么就应该推荐此类型的电影。

准备

本文所用数据来自kaggle，包含了76000个用户样本。

首先，导入数据和有关库。

from recsys import * 
from generic_preprocessing import 

from IPython.display import HTML ## 以Ipython Notebook显示

import pandas as pd,numpy as np

anime = pd.read_csv('anime.csv')
ratings = pd.read_csv('rating.csv').iloc[:5000000]

为了创建推荐系统，我们需要一个可交互的矩阵。为此，使用recsys模块中的create_interaction_matrix函数，这个函数要求以Pandas的DataFrame类型的数据为输入，输入数据的列必须有诸如用户id，项目id和评分等。此函数的中如果设置norm=True，则意味着任何评分的值都应该是正的。在这个示例中，没有必要设置，因为实际的购买数据和评分都是正的。

# 利用评分数据创建矩阵
interactions = create_interaction_matrix(df = ratings,
                     user_col = ‘user_id’,
                     item_col = ‘anime_id’,
                     rating_col = ‘rating’)
interactions.shape

然后用create_user_dict和create_item_dict函数（recsys模块）创建关于用户和项目的字典。

# 用户字典
user_dict = create_user_dict(interactions=interactions)
# 项目字典
movies_dict = create_item_dict(df = anime,
                               id_col = 'anime_id',
                               name_col = 'name')

矩阵分解模型

用recsys中的runMF函数来创建矩阵分解模型，这个函数的参数：

interaction：前面所创建的矩阵
n_components：对于每个用户和项目嵌入的数量
loss：定义一个损失函数，本例中我们使用warp损失函数，因为我们更关心矩阵的秩。
epoch：运行的次数
n_jobs：并行处理中使用的核数

mf_model = runMF(interactions = interactions,
                 n_components = 30,
                 loss = 'warp',
                 epoch = 30,
                 n_jobs = 4)

“python矩阵分解原理是什么”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识可以关注创新互联网站，小编将为大家输出更多高质量的实用文章！

本文标题：python矩阵分解原理是什么
链接URL：http://jkwzsj.com/article/psscdc.html

python矩阵分解原理是什么

原理：矩阵分解

准备

矩阵分解模型

其他资讯