首页/字影流转

  功能介绍:下一字智能推荐

在古典诗词创作过程中,常常会遇到“写到一半卡壳”的尴尬时刻。为此,我们基于 PageRank 算法 构建了一套“下一字智能推荐系统”,以辅助创作者顺畅续写。

该功能可在用户输入部分诗句时,分析其最后一个字,并结合古诗词语料中大量上下文结构,推荐若干候选字,供继续创作使用。

该功能不仅可以提升诗词创作的流畅性,也具备一定的教育意义,帮助用户了解古人用字规律,提升古典语感。

  实现原理:PageRank

  • 古诗图建模: 我们将语料中每一个字作为图中的节点,并依据句子中的先后顺序建立有向边。例如,“山川异域”会生成边:山 → 川,川 → 异,异 → 域。边的权重即该路径在全体语料中出现的频率。
  • PageRank 训练: 通过迭代计算节点间的连接强度,PageRank 为每个字分配一个重要性评分,衡量它在整体语料中的“连接中心性”。
  • 生成推荐: 在用户输入的内容中,取其最后一个字作为当前图的起点,从其出边中挑选 PageRank 值最高的 Top-K 个字作为推荐结果。系统还会智能过滤掉标点和无效字符,确保推荐实用性。

  示例展示:

【楚辞】

创作: 青青子衿,悠悠我

推荐:

评价: 推荐结果契合“我”字后常见语义,其中“心”助于情感表达,“兮”等感叹词贴近《楚辞》风格。

【宋词】

创作: 但愿人长久,千里共婵

推荐:

评价: “婵”字之后推荐了“娟”等高频组合,语义优雅且富有联想价值,极具参考意义。

 

 

六砚·数据挖掘坊版权所有