首页/语林采珠

 功能介绍:关联词语推荐

本模块基于 频繁项集挖掘(FP-Growth算法),构建诗词意象关联推荐系统。通过大规模诗词语料学习常见词组搭配,用户仅需输入一个关键词,即可获得符合古典体裁与风格的意象联想,辅助创作时“续词补句”与“意境拓展”。

借此模型,用户在输入任意关键意象或情感词时,都可获得富含文学语境与体裁规范的词语拓展,辅助形成更具古韵的创作片段。

 实现原理:FP-Growth

  • 诗句分词: 使用 jieba 分词工具,将诗词语料划分为词语序列。
  • 共现频率统计: 若某个词组在上下句中同时出现一次,视为一次有效共现,并累计其频次。
  • 频繁项集挖掘: 应用 FP-Growth 算法,设置最小支持度 min_support,从共现词对中挖掘出具代表性的词语组合。
  • 意象推荐: 用户输入任意关键词,系统将在频繁项集中搜索其高频搭配词组,形成推荐集合。

 示例展示

【楚辞】

输入: 涉江采芙蓉

推荐: 芰、裳

评价: 推荐的词不仅贴合创作者所描写的荷塘场景,而且符合楚辞的表达方式。

【唐诗】

输入: 孤舟蓑笠翁

推荐: 「孤舟」:去 「翁」:两翁、乃翁、仙翁、吟翁、山翁

评价: 对于“翁”,推荐了自然且在古诗中频繁出现的结果。

 

 

六砚斋数据挖掘坊版权所有