学术论文文本分析新工具RLetters


NeuroTimes | Jan. 7, 2016


Credits: rletters.net


RLetters是一个分析学术文章的开源在线工具,利用自然语言处理来对学术论文的进行文本分析。

目前的功能有:计算文章词频(单词或短语),比较两个数据集内的单词用法,图表表示数据集内文章的发表时间,确定单词间的搭配与单词的相关性,计算关注的网络结构,提取参考文献,多种格式输出数据集作为参考文献。

RLetters的数据库中目前有13000多篇学术文章,之来源于PLoS Genetics、PLoS Pathogens、PLoS Biology、PLoS Computational Biology、PLoS Medicine这几个杂志,相信慢慢会增加更多的文章数据。Solr后端也支持复杂的搜索,如以年限、作者或标题来搜索文章,支持布尔运算符,通配符搜索,词干提取,模糊匹配和邻近搜索等等。

地址: http://www.rletters.net/




分享到


© 2014-2015 NeuroTimes