跳到主要内容

英语文章分词去重导入背词软件

为解决单词使用与背词不匹配的问题,将个人平时看到外文站点的文章导入分析,输出单词数据可导入背词软件,通过第三方软件的艾宾浩斯遗忘曲线算法背词。

解决了什么

  • 结合遗忘曲线重复洗脑记忆
  • 完美解决背了不用的困境
    • 文章时对应个人兴趣爱好去导入,如:编曲、情爱小说、bananas等
    • 期望效果:分别对不同到领域,提取真正用到的单词

开发步骤分析

  • 英语分词
  • 检查拼写错误
  • 去重、去复数、去时态,简单来说还原基本单词
  • 去掉简单词汇,如:me、you、to
  • 输出“单词数据”,如:有道云

技术:属于「自然语言处理」范畴,上游类别是「人工智能」

关键技术

  • nltk 自然语言处理
  • pandas 表单处理

下一步行动

由于找到更合适的移动端app(百词斩)来学习,项目将暂停开发。

分析一下app的好处

  • 直接通过句子学习
  • 单词翻牌为单词原型(区别于其他背词软件)
  • 还有训练模型供快速复习