推荐系统是大数据分析中的一个重要应用,特别是在电商、社交媒体等行业。常见的问题是如何根据用户行为、兴趣等数据,构建有效的推荐模型。
如何使用协同过滤算法构建简单的推荐系统?
import pandas as pd from sklearn.neighbors import NearestNeighbors# 假设数据包含用户评分 data = pd.read_csv('ratings.csv')# 创建用户-商品矩阵 pivot_data = data.pivot(index='user_id', columns='item_id', values='rating').fillna(0)# 使用KNN计算相似用户 knn = NearestNeighbors(n_neighbors=5, algorithm='auto') knn.fit(pivot_data.values)# 查询与用户1最相似的用户 distances, indices = knn.kneighbors([pivot_data.iloc[0].values])# 输出最相似的用户 print(f'Most similar users to user 1: {indices}')