中国大模型语料数据联盟开源发布高质量多模态语料“书生·万卷”
2023-08-15 18:21:51 来源:新华财经
【资料图】
据上海市经信委消息,8月14日,上海人工智能实验室宣布,联合中国大模型语料数据联盟成员单位,共同开源发布“书生·万卷”1.0多模态预训练语料。
“书生·万卷”1.0目前包含文本数据集、图文数据集、视频数据集三部分,本次开源的数据总量超过2TB。该语料数据包含超过5亿个文本,2200万个图文交错文档,1000个节目影像视频,具备多元融合、精细处理、价值对齐、易用高效等四大特征。
中国大模型语料数据联盟是由上海人工智能实验室联合中央广播电视总台、人民网、国家气象中心、中国科学技术信息研究所、上海报业集团、上海文广集团、上海数据集团、上海市数商协会、金杜律师事务所等单位联合发起成立的开放组织。
(文章来源:新华财经)
关键词:
[责任编辑:xwzkw]
相关阅读
- (2023-08-15)中国大模型语料数据联盟开源发布高质量多模态语料“书生·万卷”
- (2023-08-15)战争和潮湿的田地使世界缺乏优质小麦
- (2023-08-15)特斯拉撑不住了,降价1.4万,8月已有10家车企“开战”
- (2023-08-15)科大讯飞上半年营收78.4亿元,大模型商业价值开始显现
- (2023-08-15)意大利埃特纳火山持续喷发 附近机场关闭
- (2023-08-15)统计局:8月上旬全国煤炭价格各有涨跌
- (2023-08-15)中核钛白:拟不超9.36亿元收购双阳磷矿、新天鑫化工100%股权
- (2023-08-15)五桥双发八节臂,城市高空吊装之王!XCA260L8邀您一起冲冲冲!
- (2023-08-15)逆水寒手游荒城剑气获取攻略
- (2023-08-15)大美中国
- (2023-08-15)教育部公布第二批全国高校“百个研究生样板党支部”和“百名研究生党员标兵”创建培育工作验收通过名单
- (2023-08-15)国家统计局:7月中国粗钢日产292.9万吨,环比降3.6%
- (2023-08-15)南京直飞台中航线将于9月恢复
- (2023-08-15)西安警方开展打击违规倒卖旅游景点门票专项行动
- (2023-08-15)车都建设底价竞得P(2023)049号地块
- (2023-08-15)诚迈科技8月15日盘中跌幅达5%
- (2023-08-15)最高法发布司法解释 明确破坏森林资源犯罪定罪量刑标准
- (2023-08-15)秋日出游建议:去大陈,玩山
- (2023-08-15)王菲有多难再嫁出去?哪怕跟谢霆锋谈了九年,他都没有娶她的打算
- (2023-08-15)强力卸载工具哪个好用
- (2023-08-15)NASA:今年七月为有记录以来最热月份
- (2023-08-15)医药领域行业整治影响如何,哪些细分板块将受益?
- (2023-08-15)全国中学生五子棋锦标赛闭幕——秦皇岛14名参赛选手11人进入八强
- (2023-08-15)中国平安:2023年前7月保费收入5213.47亿元,位居行业第一
- (2023-08-15)建研设计(301167.SZ):无自主研发的设计软件,但建有自己的数据存储档案库
- (2023-08-15)全聚德上半年净利同比大增118.28% 在新常态下打赢经营翻身仗
- (2023-08-15)哈尔滨肯德基(哈尔滨肯德基)
- (2023-08-15)贵阳市第一人民医院原党委副书记、院长张云强接受纪律审查和监察调查
- (2023-08-15)8月18日开启盲订,一汽奔腾小马的“潮趣”属性究竟有多诱人?
- (2023-08-15)【梦华录】悲情男主拯救系统(四)