我对文本分析很感兴趣,我应该从哪里开始学习呢? 初学者的算法和东西?
有关自然语言处理的教科书列表,请参阅我对这个问题的回答。此外,Lucene in Action 是一本关于领先的全文搜索库的实用书籍。同样,lucid imagination 是一家新公司,拥有大量有关信息检索的文章。
Paul Graham 的 垃圾邮件检测论文系列 是有趣的轻松阅读,并且有一些研究链接。
你可以尝试寻找科学论文。
从Google Scholar中的关键字搜索开始, 每篇论文都有很多参考文献,这对你来说应该是一个很好的起点。
我发现这也很有信息量: http://www.youtube.com/watch?v=kKe4M4iSclc