【摘要】人工智能大模型产业发展的三要素为算法、算力与数据,其中训练数据语料库的质量直接决定了人工智能大模型的能力。中文数据语料总量相较英文数据语料严重不足,同时存在数据采集行为违法风险较高、公共数据开(试读)...