【思路】【开源】文本标点符号自动标注
Ta的回复 :感谢楼主的思路:我觉得楼主的前三个词的判断可以改为分词,标点前后的词语,再统计概率。 当然,这其中可能会涉及到一些数学问题。本文评论有人提到了这个古籍标注的工作,我使用了一下,对现代文也可以,而且可以看到概率 ,不知道是不是用的统计的思想。 深度学习的中文标注代码有2020年国防科大的开源,不过我还没使用。 我使用jieba等分词,完成了加标点的功能,使用python代码:https://github.com/SFUMECJF/zho_add_punctuation