功能介绍:关联词语推荐
本模块基于 频繁项集挖掘(FP-Growth算法),构建诗词意象关联推荐系统。通过大规模诗词语料学习常见词组搭配,用户仅需输入一个关键词,即可获得符合古典体裁与风格的意象联想,辅助创作时“续词补句”与“意境拓展”。
借此模型,用户在输入任意关键意象或情感词时,都可获得富含文学语境与体裁规范的词语拓展,辅助形成更具古韵的创作片段。
实现原理:FP-Growth
- 诗句分词: 使用
jieba
分词工具,将诗词语料划分为词语序列。 - 共现频率统计: 若某个词组在上下句中同时出现一次,视为一次有效共现,并累计其频次。
- 频繁项集挖掘: 应用
FP-Growth
算法,设置最小支持度min_support
,从共现词对中挖掘出具代表性的词语组合。 - 意象推荐: 用户输入任意关键词,系统将在频繁项集中搜索其高频搭配词组,形成推荐集合。
示例展示
【楚辞】
输入: 涉江采芙蓉
推荐: 芰、裳
评价: 推荐的词不仅贴合创作者所描写的荷塘场景,而且符合楚辞的表达方式。
【唐诗】
输入: 孤舟蓑笠翁
推荐: 「孤舟」:去 「翁」:两翁、乃翁、仙翁、吟翁、山翁
评价: 对于“翁”,推荐了自然且在古诗中频繁出现的结果。