摘要:[目的/意义]理论是情报学学科构建与发展中至关重要的组成部分,对理论的梳理与分析不仅有助于理解情报学学科的起源与发展脉络,也能够预测新兴技术的发展,高效和准确地识别理论实体对于促进理论研究的深化具有极为重要的作用。[方法/过程]本文提出了一种大小模型协同的情报学理论实体抽取算法,包括词嵌入向量增强、样本难度评估和理论识别模型3个模块。首先利用大型语言模型对理论实体进行预识别,预识别的实体与句子中的原始词嵌入向量构成增强词嵌入向量,通过增强的词嵌入向量优化领域小模型的训练过程。此外,本文利用大模型对样本的难度进行评估,并据此调整训练策略,以提高模型性能。该算法充分结合大型语言模型强大的语义理解能力以及领域小模型的专业性。[结果/结论]在情报学理论实体抽取数据集上展开实验,结果表明本文提出的算法有效提升了理论实体抽取的性能,在精确率、召回率、F1指标上均实现了最优结果。
摘要:[目的/意义]当前基于知识图谱的主流推荐算法主要对项目侧知识进行挖掘利用,较少关注用户侧的辅助信息,存在用户数据稀疏和挖掘深度不够等问题。[方法/过程]针对用户侧和项目侧辅助信息的结构及特征差异,提出了一种融合社交关系和知识图谱的双图注意力推荐模型。首先,将用户社交网络图和项目知识图谱分别与用户一项目交互图融合,得到用户社交关系协同图和项目协同图。其次,利用双图注意力网络分别处理这两个知识图谱,提取不同的用户和项目特征向量。然后,通过注意力机制融合得到的用户和项目特征向量。最后,利用向量间的内积运算得到用户和物品的交互概率进行推荐。[结果/结论]在Douban和Last-FM数据集上进行的实验表明,该模型在各个数据集上的性能优于其他基准模型。
摘要:[目的/意义]为有效解决基元学习器和集成模型对单形态特定模式的依赖和局限,本文通过加大观察粒度将分类器拓展为可适应多形态混合模式的分类器,以期提升模型理解能力和分类能力。[方法/过程]本文以概念集替代原始特征,引入互斥概念集和正交样本集的概念,对样本进行分离、归纳和融合,构建概念格融合模型,并从模型特质、模型能力、模型品质及过拟合4个方面对模型进行评价。[结果/结论]以亚马逊23971条评论为样本集的测算结果表明,概念格融合模型在准确性、稳定性、抗干扰性等方面都有较大提升,且模型评价结果表明该模型具有更佳的内在品质。
摘要:[目的/意义]测试GPT等生成式大模型在摘要结构功能识别这一判别式任务上的可行性及应用潜力,为基于生成式大语言模型构建高质量结构化数据提供参考。[方法/过程]采用单轮、零样本提示的方式基于GPT 4.0、Qwen l.5和ERNIE 4.0实现结构功能分类任务,根据领域、语种、时间划分构建不同的测试子集,以P、R、F1和准确率为评估指标,以单因素方差分析结果衡量不同测试子集间的性能差异程度。[结果/结论]大语言模型的输出不完全与提示中的约束一致,说明使用生成式模型解决判别式任务时,输出结果存在不可控风险,但符合提示的输出比例较高说明使用生成式模型解决判别式任务基本可用。不同大语言模型的性能表现不同,GPT4.0和ERNIE4.0在不同结构功能类别样本的所有指标、不同领域样本的R和准确率、不同语种样本的P和F1均表现出0.01水平显著性,其他则无显著差异。未来基于生成式大语言模型解决判别式任务时应着重关注输出结果的可控性、领域自适应等问题。
摘要:[目的/意义]为构建专门适用于中医古籍文本的相似度计算模型,解决BERT在中医古籍文本上语义表征困难和数据标注成本高昂的问题。[方法/过程]本文在多个模型增量预训练的基础上,利用生成式AI生成全部任务数据,结合SimCSE方法,对比不同训练方式、预训练模型、正负样本构造方法、正样本混合策略的作用。[结果/结论]研究结果显示,无监督学习模型性能普遍偏低,引入AI生成的正负样本对后性能明显提升。其中,使用AI构建的语义不同的、相似性较低的负样本,并与采用AI辅助的同义词替换方法构建的正样本混合而成的训练集上,TCM-Gujiroberta模型性能最佳,达到90.9%;此外,选择相似性较低的负样本并随机混合不同类型正样本的数据集可进一步提升模型性能。本研究在零样本情境下,设计出一种融合中医古籍知识的SimCSE相似度计算模型,可为古籍研究和应用提供支持,未来考虑在数据集构建策略方面进一步优化。
摘要:[目的/意义]本文研究了用户对人工智能生成内容(AIGC)信息回避的成因与作用机制,为用户信息行为引导、AIGC技术优化和AIGC产品迭代提供理论参考。[方法/过程]基于认知一情感一意愿(Cognition-Affect-Conation,C-A-C)框架,构建信息可控度、信息透明度和AI焦虑影响信息回避的理论模型,通过虚拟实验方式获取样本数据,并利用偏最小二乘法结构方程模型(PLS-SEM)对数据及模型进行分析与验证。[结果/结论]结果表明,用户对人工智能生成内容(AIGC)的信息回避行为在不同AIGC信息透明度与可控度之间存在显著差异,AI焦虑与信息回避行为有正向关系。研究发现,AI身份威胁对AIGC信息不确定性与AI焦虑之间的关系有正向调节作用。
摘要:[目的/意义]解析科研场景下AIGC用户采纳意愿影响因素之间复杂的关联关系以及是否存在单一因素对用户采纳意愿产生必要性影响,为AIGC在科研场景中的推广和应用提供理论和实践参考。[方法/过程]运用必要条件分析和模糊集定性比较分析方法对522份问卷数据进行分析,探究单一因素的必要性和组态路径的充分性。[结果/结论]研究发现,不存在单一因素对AIGC用户采纳意愿产生必要性影响,在影响因素组态路径中存在11条用户高采纳意愿路径和4条用户低采纳意愿路径。其中,感知质量、感知有用性、感知易用性、感知任务技术匹配度、感知信任、社群影响、用户期望7个影响因素在组态路径中均作为核心条件或边缘条件对用户采纳意愿产生重要作用。
摘要:[目的/意义]智能时代,人工智能生成内容逐渐成为创作领域的新兴工具与核心内容,影响着创作者的创作过程与成效。探讨人工智能生成内容对创作者工作重塑的影响,可为人智协同创作水平、人智关系的提高提供具体参考。[方法/过程]研究通过Credom平台进行两次实验研究,参考CAT模型和AIGC技术、内容双重特征的维度框架,分析了AIGC驱动工作重塑的影响机制。[结果/结论]研究发现,人工智能生成内容对创作者工作重塑具有积极影响,在具体影响机制中内容的感知娱乐性对情感依恋具有促进作用,技术的感知有用性对自我效能具有积极影响。同时自我效能和情感依恋将进一步影响工作重塑,且认知重塑在驱动任务重塑和关系重塑的过程中具有显著的中介作用。本文拓展了AIGC在人智交互领域的研究内容,研究结论对深化人工智能与创作者工作的理论关系具有一定的边际贡献,同时,在实践层面也将为创作者与环境的弥合、人智协同创作水平的提高提供具体参考。
关键词:融媒体:信息生态:运行机理:演化机制;实证分析 融媒体已成为现在网络信息的主流形式,习近平总书记在十九届中央政治局第十二次集体学习中强调:推动媒体融合发展、建设全媒体成为我们面临的一项紧迫课题,要运用信息革命成果,推动媒体融合向纵深发展,做大做强主流舆论,巩固全党全国人民团结奋斗的共同思想基础。大数据时代的到来推动了融媒体向更加智能化、个性化和高效化的方向发展,同时也对融媒体信息传播的管
摘要:[目的/意义]新时代东北全面振兴取决于科技人才的有力支撑,科技人才政策是推动科技创新与人才发展的重要制度保障。通过对科技人才政策进行系统的量化分析,旨在准确把握区域科技人才政策的框架结构和动态特征,为深化政策供给侧改革提供决策参考。[方法/过程]本研究以黑龙江省、吉林省、辽宁省三省的科技人才政策文本为研究对象,运用BERTopic模型对其政策文本进行主题识别、关键词提取、相似度计算等,在此基础上开展各省政策主题的纵横向比较,并与粤苏浙鲁等发达省份的政策进行对比分析。[结果/结论]东北三省科技人才政策已形成了以人才引进、培养、使用、评价、激励、服务为主线的政策体系,但与发达省份相比,在政策供给、需求牵引、针对性等方面还存在不足。据此,本研究提出,东北三省应立足区域实际,提升人才政策的系统性、精准性、时效性,聚焦政策供给、需求牵引、区域特色等关键问题,在人才政策的集成优化、创新发展上持续发力,以新时代人才政策变革引领和保障全面振兴、高质量发展。
摘要:[目的/意义]科研人员积极的共享意愿、数据共享平台负责的共享行为及政府部门的监督管理等决策对我国数据共享效率提升有重要意义。[方法/过程]首先,分析科研数据共享关键主体博弈关系;其次,构建科研人员、数据共享平台与地方政府监管部门三方主体的演化博弈模型,分析各主体决策博弈在多情景下的动态演化过程及均衡策略;最后,利用MATLAB模拟仿真各主体初始意愿和各参数变化对科研数据共享活动的影响。[结果/结论]结果表明,在科研数据共享活动中,三方主体的初始策略选择及其相互作用都会对科研数据共享活动产生显著影响:促使数据共享平台由“违规共享”转向“合规共享”的主要因素是监管部门罚款及科研人员的追偿能力;影响科研人员博弈策略的主要因素是监管部门激励补贴及数据共享总收益;影响监管部门博弈策略的主要因素是监管成本及上级政府问责。
摘要:[目的/意义]探究政府数据开放中用户隐私保护行为的影响因素及其行为产生机制,旨在引导用户积极参与隐私保护、提高政府数据开放中个人隐私保护效能。[方法/过程]基于动机一机会一能力理论( Moti-vation-Opportunity-Ability,MOA),构建政府数据开放中用户隐私保护行为产生机制研究模型,利用结构方程模型( SEM)和模糊集定性比较分析(fsQCA)方法对调查数据进行分析。[结果/结论]SEM结果表明,感知收益、感知成本、主观规范、平台支持、隐私素养、隐私关注显著影响政府数据开放中用户的隐私保护行为;fsQCA发现的5条组态路径可归纳为3种触发用户产生隐私保护行为的组态类型,分别是平台引导型、隐私素养驱动型和内外联动型,平台支持和主观规范分别在4条组态路径中作为核心条件出现,说明用户隐私保护行为的产生是内在动机、能力与外部机会共同作用的结果,外部环境的机会因素是用户隐私保护行为产生的核心条件,在此基础上提出相应建议。
摘要:[目的/意义]在线健康知识服务中的用户健康赋能具有场景依赖与适应性的特性,由于用户与在线健康知识服务情境下的交互方式、自主性等方面与传统医疗场景相比存在较大的差异,因此现有研究对用户健康赋能内涵和维度的阐释在在线健康知识服务下的适用性有限。本研究旨在探索在线健康知识服务中的用户健康赋能的结构维度和测量方式,以期为在线健康知识服务领域提供一个科学的、系统化的用户健康赋能评估工具。[方法/过程]本研究基于混合研究方法,首先从用户访谈资料中提炼用户健康赋能的结构维度,并进一步遵循规范化的流程开发测量量表。[结果/结论]在线健康知识服务中的用户健康赋能是由3个二级构念(包括心理赋能、结构赋能、资源赋能)以及8个三级构念构成的形成型构念结构。其中,心理赋能与传统医疗环境中的用户健康赋能识别的测量维度一致,但具体内涵更为丰富:结构赋能和资源赋能则进一步反映了在线健康知识服务情境中的医患交互新现象。正式量表包含27个题项,探索性因子分析、验证性因子分析和外部效应的检验结果表明量表具有良好的信效度和外部有效性。
摘要:[目的/意义]在线医疗社区医生数量众多,患者掌握的信息却有限。医生头像作为一种视觉符号,是患者接触的一手信息,影响患者决策行为。通过分析医生头像信息对患者决策行为的影响,以期为在线医疗社区中医生自我呈现、患者决策以及平台运营优化提供支撑。[方法/过程]以好大夫在线为研究情境,抓取好大夫在线平台中代表性科室共47704名医生数据进行回归分析,基于自我呈现理论,探究医生头像内容与头像质量对在线医疗社区中患者决策行为的影响。[结果/结论]研究发现,除头像丰富度对患者决策行为没有显著影响,头像真实性、头像专业性、头像亲和力、头像焦点性以及头像清晰度均对患者决策行为具有显著影响。