重庆网站建设 cqhtwl,建设网站需要哪些条件,武强营销型网站建设费用,网站被降权会发生什么影响文章目录StanfordcoreNLPStanzaTankitspaCySuPar总结StanfordcoreNLP
这个老早就出来了#xff0c;用java写的#xff0c;但是已经有很多比他效果好的了。
Stanza
2020ACL发表的#xff0c;看名字就知道和上一个是同一家的。
用已经切好词的句子进行依存分析。
这个功能…
文章目录StanfordcoreNLPStanzaTankitspaCySuPar总结StanfordcoreNLP
这个老早就出来了用java写的但是已经有很多比他效果好的了。
Stanza
2020ACL发表的看名字就知道和上一个是同一家的。
用已经切好词的句子进行依存分析。
这个功能有什么好处呢 一开始一直不知道这个功能的好处这个就是在你已有数据集的基础上想加点依存或者句法等信息进去的时候切好词放进去能确保分析结果一一对应不然切词器用的不一样结果是不能完美对应回去的这样处理起来就非常恶心了。
按道理来说应该每个切词器都会有这个功能吧。
import stanza
nlp stanza.Pipeline(langen, tokenize_pretokenizedTrue)
doc nlp([Stanza is a powerful$NLP library..split()])
for sent in doc.sentences:print(sent.print_dependencies())输出结果
Tankit
2021EACL文章里的 看这结果好像比Stanza好但是实际上使用人数Stanza更多毕竟老行家老客户多而且github上回答问题也很积极就是说售后工作不错实验效果的话可能还是Stanza会好些。
spaCy
这东西主要是快工业用的做研究为了效果应该不差这点时间。看过没用过。
SuPar
https://github.com/yzhangcs/parser 封装了Biaffine和CRF等用了解析依存树或者句法树的模型不过我好像试了没运行成功好像是模型下太慢了用户体验其实不怎么样但是它里面说效果是SOTA但现在毕竟2023只能说效果不会差工具不算老。
总结
应该还有很多上面主要是对应英文的但是其实他们也大部分支持中文对于中文也有很多如jieba哈工大的LTP百度LACjiagu等等。
工具很多知道名字才能进行信息搜集和对比不然要干啥都不知道。