Image Description
Image Description

下面是搜索自然语言处理有哪些数据集?的结果...

Image Description
Image Description
Image Description
上传于 2019-06-07 admin

数据格式 该数据主要是 travel.sohu.com 下的新闻类别数据,有详细的标注作者、内容、时间、url等信息。{'author': '心在旅途','content': "\n心房颤动(房颤)的主要风险之一为栓塞,并且是缺血性卒中的独立危险因素之一,其导致卒中/短暂性

Image Description
Image Description
Image Description
上传于 2019-06-07 admin

数据格式 说明:谭松波收集整理了一个较大规模的酒店评论语料。语料规模为10000篇。语料从携程网上自动采集,并经过整理而成。为了方便起见,语料被整理成4个子集: 1.ChnSentiCorp-Htl-ba-2000: 平衡语料,正负类各1000篇

Image Description
Image Description
Image Description
上传于 2019-06-06 admin

数据格式 这个是带标注的微博数据,含有词性标注以及情感标注,数据来自互联网。1_simplifyweibo、0_simplifyweibo、2_simplifyweibo、3_simplifyweibo. 0:喜悦

Image Description
Image Description
Image Description
上传于 2019-06-06 admin

数据格式这个是12W条微博的正负面数据,可以训练多种机器学习模型,供给学习使用。代码读取file = "情感分析60000/pos60000.txt"with open(file,"rb") as fp: lines = fp.readlines

Image Description
Image Description
Image Description
上传于 2019-06-06 admin

数据格式 该数据主要是 衣饰用品的正负面情感分析数据。 代码读取 file = "pos.txt"with open(file,"r",encoding="gkb") as fp: lines = fp.readlines()

Image Description
Image Description
Image Description
上传于 2019-06-06 admin

数据格式 该数据主要是 平板电脑的正负面情感分析数据。 代码读取 file = "pos.txt"with open(file,"r",encoding="latin-1") as fp: lines = fp.readlines()

Page 6 out of 9