过刊目录

  • 全选
    |
    专题
  • 专题
    赖茂生
    2024, 6(2): 1.
    PDF全文 ( )   可视化   收藏
    [目的/意义]梳理知识组织领域的发展脉络及其演化规律和演化的驱动因素,阐述大数据时代科技情报机构知识组织的新需求、新任务和科技情报界的创新探索。[方法/过程]初步调研了近年来在知识组织数智化方面的研究进展、面临的挑战和短板,预测了未来的发展趋势和思路,强调要走专业精英与草根相结合、人智与数智相结合的道路。[结果/结论]图书情报界的知识组织发展需要重视和加强的几个领域,即数据标注、数据集的组织与检索以及数据管理中的元数据问题。
  • 信息处理
  • 信息处理
    朱丹浩 赵志枭 吴 娜 王希羽 孙光耀 王东波
    2024, 6(2): 11.
    PDF全文 ( )   可视化   收藏
    [目的/意义]文章以古籍自动分词为切入点,引入“荀子”系列大语言模型,对大语言模型在古籍文本分词任务上的表现进行了探讨。[方法/过程]文章基于《左传》分词语料,进行了数据清洗和整理,构建了指令数据集,在此基础上,从数据集中抽取了1 000条作为测试数据,并分别使用500、1 000、2 000、5 000条数据作为训练数据进行指令微调,并测试其性能。[结果/结论]实验结果表明,只需要少量的数据,大语言模型就可以有较为理想的表现,在微调数据量达到5 000条数据时,Xunzi-Qwen-7B模型表现出了最优性能,F1值达到84.54%。
  • 信息处理
    朱丹浩 赵志枭 胡 蝶 赵文华 孙光耀 王东波
    2024, 6(2): 21.
    PDF全文 ( )   可视化   收藏
    [目的/意义]大语言模型的发展为古籍文本挖掘带来了新的思路,将大语言模型与古籍数字化、智能化相结合是新时代古籍工作的必经之路。[方法/过程]文章使用《左传》词性标注语料,通过数据清洗和预处理,构建了一批高质量的词性标注指令数据,在此基础上,分别使用500、1 000、2 000、5 000条数据对大语言模型进行指令微调,并在另外1 000条数据上进行性能测试。[结果/结论]实验结果表明,“荀子”系列模型在古籍文本词性标注任务上性能优于通用领域模型,在微调数据量达到5 000时,Xunzi-Baichuan2-7B模型表现出了最优性能,F1值达到81.67%。
  • 情报分析研究
  • 情报分析研究
    毛太田 汤 淦 陈进亮
    2024, 6(2): 30.
    PDF全文 ( )   可视化   收藏
    [目的/意义]政府数据开放是政府数字化发展的方向,探究政府数据开放平台(OGDP)对数字政府发展的影响,对推进实现国家治理体系和治理能力现代化目标具有指导意义。[方法/过程]文章基于OGDP的建设与否,运用倾向得分匹配(PSM)方法,以全国101个地级市2019年的截面数据为研究样本进行实证分析,探究OGDP建设对数字政府发展的促进作用。[结果/结论]在克服样本选择偏误以及尽可能消除不可观测因素带来的内生性影响的情况下,研究发现OGDP的建设能够正向影响数字政府发展,建设OGDP的城市的数字政府发展效应要比未建设的高15%—25%。因此,建议从加强OGDP建设、提升数据开放主动性和质量、优化平台服务、建设国家级OGDP等方面促进数字政府发展。
  • 情报分析研究
    徐绪堪 李 溢 唐 津
    2024, 6(2): 42.
    PDF全文 ( )   可视化   收藏
    [目的/意义]在个人信息保护日渐重要的今天,开展我国社交媒体隐私政策合规性评价研究,可为完善社交媒体隐私政策和加强个人信息保护提供参考。[方法/过程]文章选取28个常用社交媒体,基于LDA主题模型、完整性评价和阅读感分析对其隐私政策文本进行比较分析。[结果/结论]研究发现,随着相关信息保护法的出台,社交媒体在隐私保护、信息安全等方面已取得了积极进步,但在政策完整性、特殊群体的保护和可读性方面仍有进一步完善的空间。未来,可从法制建设和用户权利保障、特殊群体保护以及文本可读性3个方面进行完善。
  • 情报分析研究
    吴小兰 章成志
    2024, 6(2): 58.
    PDF全文 ( )   可视化   收藏
    [目的/意义]在国家自然科学基金项目申请中,同一个学者在不同时间使用不同学科基金代码,这在一定程度上促进了跨学科知识的融合与生长。为此,文章基于国家自然科学基金跨学科申请视角,挖掘跨学科知识及其融合生长路径。[方法/过程]首先,结合自然科学基金学科申请代码的层级结构,改进并优化了跨学科性测度指标,识别最具有跨学科性的跨学科知识。随后,构建跨学科知识与一级学科的二类型异质网络,并基于RankClus实现了跨学科知识社区发现与生长路径挖掘。[结果/结论]研究发现,存在显著的12个跨学科知识主题与6个明显的知识生长路径,其知识生长路径分别是生命科学部-医学科学部(C-H)、化学科学部-工程与材料科学部(B-E)、生命科学部—地理科学部(C-D)、数理科学部—信息科学部—管理科学部(A-F-G)、数理科学部—地理科学部—工程与材料科学部(A-D-E)、化学科学部—管理科学部(B-G)。
  • 情报分析研究
    王仪雯 谭春辉 薛晓斐 王学东
    2024, 6(2): 72.
    PDF全文 ( )   可视化   收藏
    [目的/意义]网络媒体平台在突发公共事件中发挥着重要作用。通过对不确定环境下网络媒体平台管控行为的随机演化博弈分析,为网络媒体平台舆论管控提供建议。[方法/过程]基于Moran过程的随机演化模型,将自然选择规则作为策略更新规则,探讨了影响网络媒体平台管控行为的因素,分析了外部随机性因素和内部因素主导情境下的均衡结果。[结果/结论]研究发现,网络媒体平台管控行为主要受外部随机性因素、平台数量规模、不同管控行为的成本收益影响。外部随机性越小、平台管控收益越大且成本越小,积极管控的扎根概率就越大,平台数量规模存在着一个能够有效管控突发公共事件的临界值,能为突发公共事件中网络媒体平台管控提供新思路。
  • 情报工作研究
  • 情报工作研究
    韩 普 叶东宇
    2024, 6(2): 88.
    PDF全文 ( )   可视化   收藏
    [目的/意义]为了更充分利用文本依存句法信息和先验情感知识在情感分析中的价值,提出了一种语义增强的在线健康社区情感分析模型。[方法/过程]首先预处理在线健康社区数据,并通过BERT生成特征向量;接着基于双通道思想,利用TextCNN和BiLSTM分别抽取在线评论文本的局部和全局信息,然后在GAT中融入情感知识和文本依存句法信息进行语义增强;最后进行双通道特征拼接,并在全连接层实现在线健康社区情感极性判断。[结果/结论]通过对31 718条在线健康社区评论数据进行对照实验发现,基于语义增强的BERT-TBGH模型准确率达到90.77%,相比基准模型TextCNN和BiLSTM分别提升了10.57%和7.79%,引入情感知识和字粒度依存句法信息后,准确率分别提升了1.85%和1.00%。文章提出的基于语义增强的BERT-TBGH模型能够有效提升在线健康社区情感分析效果。
  • 情报工作研究
    彭丽徽 汤林峻 李茜丹
    2024, 6(2): 100.
    PDF全文 ( )   可视化   收藏
    [目的/意义]聚焦突发公共卫生事件下老年人的健康信息规避行为,识别影响老年人健康信息规避行为的关键因素,为老年人防疫健康管理提供决策参考。[方法/过程]基于MOA理论,构建突发公共卫生事件下老年人健康信息规避行为关键影响因素指标体系。使用三角模糊数Dematel方法确立因素之间的因果关系,并借助DANP方法将识别出的关键影响因素进行权重量化。[结果/结论]调节情绪和代际考量(M),信息效用和社会防疫态度(O),风险感知、信息需求感知、自我效能感和社会压力感知(A),是突发公共卫生事件下老年人健康信息规避行为的关键影响因素,文章基于此提出相关应对策略,为保障疫情防控效率、提升老年人健康管理决策提供科学指导。
  • 情报工作研究
    陈昱成 黎 洋 刘江峰 杨 帆
    2024, 6(2): 115.
    PDF全文 ( )   可视化   收藏
    [目的/意义]非遗是人类文明的重要组成部分,对于保护和弘扬民族精神,增强民族认同感和凝聚力具有重要意义。[方法/过程]文章探讨如何利用AIGC的优势,结合传统深度学习的方法,构建一个全面、高效的非遗知识图谱。[结果/结论]在非遗项目分类研究中,微调后的Baichuan-7B效果最佳,macro-F1值为0.7688,在非遗属性信息抽取中,RoBERTa的效果最好,F1值为0.7085。微调Baichuan-7B生成的结果,BLEU的2-Gram为0.2052。结合属性抽取和生成的结果,构建了高效全面的知识图谱。[创新/局限]文章利用生成式大模型辅助建立知识图谱,对国家级的非遗项目进行了研究,暂未对具有较高研究价值的省级项目进行研究。