Image Description
Image Description

下面是搜索自然语言处理有哪些数据集?的结果...

Image Description
Image Description
Image Description
上传于 2019-06-07 admin

数据格式PFR人民日报标注语料库(版本1.0,下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下,以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。该语料库对600多万字节的中文文章进行了分词及词性标注

Image Description
Image Description
Image Description
上传于 2019-06-06 admin

数据格式该数据主要是敏感词库大全,里面包含了暴恐词库、反动词库、民生词库、敏感词库表统计、色情词库、贪腐词库等。 代码读取 import pandas as pdfile = "敏感词库表统计.xlsx"df = pd.read_excel(file)

Image Description
Image Description
Image Description
上传于 2019-06-07 admin

数据介绍{'author': '深圳证券交易所', 'content': '深交所网站消息,深圳市盛讯达科技股份有限公司首次公开发行股票网上定价发行有效申购户数为8,482,288 户,有效申购股数为54,499,255,500 股,配号总数为 108,998,511个,起始号码

Image Description
Image Description
Image Description
上传于 2019-06-07 admin

数据介绍{'author': '黄德海', 'content': "'(本文来源,江苏文艺出版社公众账号)'", 'date': '2016-01-04', 'domain': 'book.sohu.com', 'source': '搜狐读书', 'title': '评韩东《爱

Image Description
Image Description
Image Description
上传于 2019-06-07 admin

数据介绍{'author': '金彧','content': "'(本文来源,江苏文艺出版社公众账号)'",'date': '2016-06-03','domain': 'money.sohu.com','source': '新京报','title': '北京有望迎来首家民营银行

Image Description
Image Description
Image Description
上传于 2019-06-07 admin

数据介绍{'author': '熊飞', 'content': '搜狐汽车新车又到了春暖花开的季节,动物们迎来了......不对应该是车企们又到了发布新车的季节。今天小编和大家一起看看即将在3月18号上市的雷诺紧凑级SUV“新”作——东风雷诺科雷嘉。虽然这样说,但是大家都知道科雷嘉

Page 8 out of 9