利用爬虫技术建立机器翻译的语料库。具体思路可以参考知乎大V刘 飞的文章:网上双语的资源还是挺多的,利用爬虫技术在爬取网页时 对当前网页进行简易判断,如果有双语嫌疑,则收录整理出来双语的 正文;如果没有,弃用; 将正文内容进行详细判断 ...
说明:如果访问 GitHub 比较慢的话,可以关注我的知乎账号(Python-Jack),上面的“从零开始学Python”专栏(对应本项目前 20 天的内容)比较适合初学者,其他的专栏如“数据思维和统计思维”、“基于Python的数据分析”、“说走就走的AI之旅”等也在持续更新中 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果