“研究方法专题” 栏目所有文章列表

(按年度、期号倒序)

  • 一年内发表的文章
  • 两年内
  • 三年内
  • 全部

Please wait a minute...
  • 全选
    |
  • 研究方法专题
    郝家亿 王玉琢 章成志
    科技情报研究. 2025, 7(1): 16-29. https://doi.org/10.19809/j.cnki.kjqbyj.2025.01.002
    [目的/意义]情报学研究方法是该领域的重要研究方向之一,构建细粒度研究方法语料库并进行研究方法实体抽取,有助于学者快速了解该领域的研究方法,探索方法演变及其未来发展趋势,为后续数字化浪潮下实现研究方法语料库的服务与应用奠定基础。[方法/过程]首先,文章以《情报学报》2000—2023年发表的学术论文为数据来源,从中随机抽取50篇并对其中的研究方法实体进行人工标注,将其作为实体抽取训练语料;其次,对BERT-base-chinese和Chinese-BERT-wwm-ext 2种模型进行训练并选择性能较优的模型进行研究方法实体抽取;最后,根据较优实体抽取模型,从未标注语料中抽取细粒度研究方法实体。[结果/结论]文章构建了一个包含理论实体、方法实体、数据集实体、指标实体、工具实体和其他实体6类情报学细粒度研究方法标注语料库。在基于人工标注语料对实体抽取模型进行训练的任务中,Chinese-BERT-wwm-ext模型表现更佳,准确率、召回率和F1值分别为0.808 2、0.846 7和0.827 0。此外,文章对研究方法实体及其类别进行分析,发现情报学研究方法日益多样化,新兴技术与传统方法并存、各有优势。
  • 研究方法专题
    李奎良 化柏林
    科技情报研究. 2025, 7(1): 30-40. https://doi.org/10.19809/j.cnki.kjqbyj.2025.01.003
    [目的/意义]方法类实体与应用场景、问题、组织机构等实体之间存在着较多的关联关系,抽取这些实体关系有助于捕捉技术发展趋势,助力创新能力提升。[方法/过程]文章探讨了一种基于自动生成句法模板的方法类实体关系抽取方法,通过设计一种新的自适应模板,提高抽取的灵活性和适应性,降低对大规模标注数据的依赖。文章实证以CSDN人工智能主题博客为例,使用少量种子三元组迭代生成句法模板抽取方法类实体及其关系,并通过过滤器模型提高抽取质量。[结果/结论]经过5轮迭代抽取,模型抽取三元组的精确度达到55.2%,优于现有通用模型。研究结果表明,该方法能够高效利用有限的标注数据,实现特定领域方法类实体及其关系的高效抽取,为学术界和产业界的科技情报分析提供支持。
  • 研究方法专题
    魏瑞斌 王伊丹 徐 艳
    科技情报研究. 2025, 7(1): 41-52. https://doi.org/10.19809/j.cnki.kjqbyj.2025.01.004
    [目的/意义]引文网络的主路径分析可以对特定领域的重要文献进行识别,并能实现主流研究线索提取。文章旨在利用主路径分析方法,对知识图谱的研究路径进行分析,梳理其研究发展的脉络。[方法/过程]文章首先从Web of Science平台获取知识图谱领域的研究论文,然后利用HistCite软件生成文献的直接引证网络,再将数据导入到Pajek中,生成该数据集的多条主路径,并结合主路径上论文的内容进行定性分析。[结果/结论]通过主路径分析,可以快速识别出知识图谱领域的一些主路径,如知识图谱的构建、知识图谱在推荐和问答等应用场景中的研究、知识图谱在制造业等特定应用领域的应用研究,折射出知识图谱技术的发展脉络和研究方向。综述性研究在知识图谱领域的发展中扮演了重要角色,为领域内的深入研究提供了基础和方向。
  • 研究方法专题
    化柏林 王英泽
    科技情报研究. 2025, 7(1): 53-64. https://doi.org/10.19809/j.cnki.kjqbyj.2025.01.005
    [目的/意义]大语言模型凭借着对大规模数据集处理的较强能力和在各项自然语言处理任务中的超群表现,在各行业中皆有出色发挥,而情报领域以文本数据为主要信息源,所以大语言模型非常适用于情报工作,并为情报实践带来了新一轮变革浪潮。[方法/过程]从文本的低维稠密向量表示、大规模预训练模型、微调与提示学习、高质量大规模训练数据、人类对齐技术5个维度讨论了大语言模型的优势。[结果/讨论]大语言模型在情报识别、情报跟踪、情报比评、情报预测等情报任务中皆有广泛应用,且带来了显而易见的优化提升或范式改变。
  • 研究方法专题
    孙光耀 王东波,
    科技情报研究. 2025, 7(1): 65-74. https://doi.org/10.19809/j.cnki.kjqbyj.2025.01.006
    [目的/意义]文章旨在利用大语言模型技术,探索数字人文领域研究方法的演变趋势。[方法/过程]文章主要以CNKI期刊论文数据为研究对象,选取通用中文大语言模型GLM-4,采用提示词工程、思维链,对论文摘要数据进行抽取、聚类,并通过量化处理分析其演变趋势。[结果/结论]研究表明,GLM-4能够很好地从复杂的摘要数据中识别并抽取出研究方法。按时序变化分析演变趋势,发现“访谈调研”“扎根理论”等研究方法逐渐边缘化,机器学习等相关研究方法逐步成为主流。文章揭示了中文数字人文领域研究方法的演变趋势,赋予数字人文的研究成果更为丰富且全面的文化内涵。