功能介绍:下一字智能推荐
在古典诗词创作过程中,常常会遇到“写到一半卡壳”的尴尬时刻。为此,我们基于 PageRank 算法 构建了一套“下一字智能推荐系统”,以辅助创作者顺畅续写。
该功能可在用户输入部分诗句时,分析其最后一个字,并结合古诗词语料中大量上下文结构,推荐若干候选字,供继续创作使用。
该功能不仅可以提升诗词创作的流畅性,也具备一定的教育意义,帮助用户了解古人用字规律,提升古典语感。
实现原理:PageRank
- 古诗图建模: 我们将语料中每一个字作为图中的节点,并依据句子中的先后顺序建立有向边。例如,“山川异域”会生成边:山 → 川,川 → 异,异 → 域。边的权重即该路径在全体语料中出现的频率。
- PageRank 训练: 通过迭代计算节点间的连接强度,PageRank 为每个字分配一个重要性评分,衡量它在整体语料中的“连接中心性”。
- 生成推荐: 在用户输入的内容中,取其最后一个字作为当前图的起点,从其出边中挑选 PageRank 值最高的 Top-K 个字作为推荐结果。系统还会智能过滤掉标点和无效字符,确保推荐实用性。
示例展示:
【楚辞】
创作: 青青子衿,悠悠我
推荐: 兮、之、心、为、与
评价: 推荐结果契合“我”字后常见语义,其中“心”助于情感表达,“兮”等感叹词贴近《楚辞》风格。
【宋词】
创作: 但愿人长久,千里共婵
推荐: 娟、韵、懒、媛
评价: “婵”字之后推荐了“娟”等高频组合,语义优雅且富有联想价值,极具参考意义。