Image Description
Image Description

下面是搜索自然语言处理有哪些数据集?的结果...

Image Description
Image Description
Image Description
上传于 2019-06-06 admin

数据格式 该数据主要是 平板电脑的正负面情感分析数据。 代码读取 file = "pos.txt"with open(file,"r",encoding="latin-1") as fp: lines = fp.readlines()

Image Description
Image Description
Image Description
上传于 2019-06-06 admin

数据格式 该数据主要是 1W条酒店的正负面情感分析数据。 代码读取 file = "pos.txt"with open(file,"r",encoding="latin-1") as fp: lines = fp.readlines()

Image Description
Image Description
Image Description
上传于 2019-06-06 admin

数据格式 该数据主要是 水果的正负面情感分析数据。 代码读取 file = "pos.txt"with open(file,"r",encoding="latin-1") as fp: lines = fp.readlines()

Image Description
Image Description
Image Description
上传于 2019-06-07 admin

数据格式 该数据主要是书籍包含正面负面的数据 代码读取 import pandas as pdfile = "test_pos.xls"df = pd.read_excel(file,names="content")

Image Description
Image Description
Image Description
上传于 2019-06-07 admin

数据格式PFR人民日报标注语料库(版本1.0,下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下,以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。该语料库对600多万字节的中文文章进行了分词及词性标注

Image Description
Image Description
Image Description
上传于 2019-06-07 admin

数据格式 该数据主要是 health.sohu.com 下的新闻类别数据,有详细的标注作者、内容、时间、url等信息。{'author': '','content': "\n心房颤动(房颤)的主要风险之一为栓塞,并且是缺血性卒中的独立危险因素之一,其导致卒中/短暂性脑缺血发作

Page 7 out of 9