南开史学如何面向人工智能时代恳谈交流会



2025 年 11 月 11 日下午,南开史学如何面向人工智能时代恳谈交流会在南开大学历史学院127召开。会议以推进数字史学重点项目申报、明确学科发展方向为核心,围绕数字史学基础资源建设、教学改革、文化传播及技术支撑等议题展开平等交流与深入研讨,旨在立足南开史学优势,推动数字技术与史学研究深度融合。

历史学院院长余新忠教授主持会议并作开场引言。他表示,学院近年来持续关注数字史学的发展趋势,在学校交叉研究平台的整体布局下,相关工作迎来新的建设窗口。围绕数字史学的战略定位,未来建设需兼顾学科传统优势与数字技术带来的新方法、新路径。数字史学的发展不仅关乎工具更新,更关系到学院在新阶段的整体学术竞争力。在保持扎实史学根基的前提下,进一步提升数字史学的研究能级,使学院在国内保持先进位置,并在更广泛的学术交流中具备相应的影响力,是后续工作中需要持续推进的方向。

王利华教授对“AI时代的历史学定位与任务”进行了系统阐述。他指出,当前人工智能技术的迅猛发展正在深刻改变知识生产方式,部分行业已出现由自动化、智能化带来的结构性调整。相比之下,高校与学术界对这一变革的感知仍相对有限,但历史学中一些程序化、机械化的工作确有逐步被技术替代的趋势,这要求史学界以更加前瞻的眼光审视自身的发展路径。面向未来,南开史学需要从两个层面进行提升。一方面立足既有优势领域,稳步推进语料库与资源库建设,探索更加高效的史料处理和知识提取工具,为学术创新奠定坚实基础;另一方面要重视数字化资源的建设与应用,推动教学方式从内容灌输向促进自主学习转变,同时关注音视频等新兴媒介在公共历史知识传播中的潜在作用,使学术成果能够以更生动、更可理解的形式服务社会。

夏炎教授就数字史学的教学建设作了补充。他指出,智慧课程是推动数字史学落地的基础,目前已有课程在智慧平台试运行,涵盖智能体与思维导图等模块,学生适应度较高。未来需形成学院特色并配套投入。AI 更适合作为课下辅助,教师课堂作用仍不可替代。本科与研究生教学改革均已将“AI 赋能”纳入评价体系,相关课程与虚拟仿真教学也在推进 AI 融合,需要在数字史学整体规划中统筹考虑。

马思宇副教授认为,数字史学的发展已成为不可回避的大趋势,国内多所高校已在教学端布局相关课程,学院在此阶段推进数字史学方向具有必要性与前瞻性。他结合自身三年来的数字人文课程与智能平台建设经验指出,信息技术迭代迅速,生成式 AI 的出现显著拓宽了史学研究与教学的可能性。在具体建设方面,他建议围绕学院已有优势,优先推进环境史、医疗史等特色领域的专题语料库建设,并以此带动南开整体语料体系与平台搭建。马思宇老师强调,教研结合至关重要,语料建设、平台实验、智能体应用均可与本科生、研究生培养相衔接。同时,大规模语料的处理、标注和算力支持需要与企业保持合作,以充分利用前沿技术、提升效率。

李宇奇副教授从考古学视角提出补充意见。他认为学院在整体规划中可适当提升考古学的比重,当前文化遗产与文博档案的数字化工作仍偏基础,尚未充分体现智能化优势。考古领域在技术应用上相对开放,图像识别、自动测量、遥感判读与三维建模均已实践,但多集中于提升效率,尚需探索方法论上的突破。他建议在虚拟教研室等机制下加强协作,并充分利用公开数据库,将百余年来的考古成果按专题如动物、植物遗存等进行系统整合,为古环境与跨学科研究奠定新的数据基础。

彭贺超副教授表示深切感到生成式 AI 对史学教学与写作带来的影响,也促使教师重新思考教学方式。他回顾此前参与虚拟仿真建设时遇到的技术转化难题,并愿意在史料云、语料库和大模型等方向上进行探索,但是技术路径与实施方法仍然是多数文科教师的困扰。

赵航老师围绕项目书提出了若干技术与实践层面的思考。他认为史料云与语料库建设的关键在于“干净数据”的获取,专题化、小规模、可控的一手史料更能避免模型误判。他同时关注历史关系识别的算法问题,正在探索基于高斯增强与预训练模型的多路径匹配,用以提升复杂人物关系与知识结构的精确度。针对技术能力的不足,他提出可通过校企合作弥补,如与算力中心和数据团队共建古籍数字化项目,由企业提供技术培训、平台与模型,学院提供专业知识与数据整理,实现资源互补与成果共享。

王美平教授主要从自身承担的重大项目出发,介绍了正在推进的日本对华认知数据库建设。在近代以来相关档案、期刊与外交材料的数字化工作中,数据库初建需要依托稳定的算力与服务器环境,也与学院正在部署的语料体系存在衔接空间。鉴于以往许多数据库因封闭化而难以发挥公共效益,未来更适合在条件允许的情况下推动资源的开放与公益化,提高史料的检索效率与学术价值。相关原始材料也可在学院整体语料库建设中提供支持,进一步夯实数字史学平台的数据基础。

朱子尧老师从自身研究经验谈到史料数字化中的若干实际问题。此前在大型法律文本中进行 OCR 与信息检索时,传统方法耗时较长,而近一年生成式模型的能力明显提升,检索效率几乎翻倍;但在处理如中古希腊语等专业文本时,不同模型在识别准确性上仍存在明显差异,这提示未来在数据库建设中需慎重选择适配的识别模型,并对指令、语料与技术路线作更细致的匹配。围绕“音画中国史”类公共传播项目,也提出内容定位与平台策略的进一步思考。

曹牧副教授的发言从环境史教学的实际需求切入。首先,在教学层面,她指出环境史具有天然的可视化优势,虚拟仿真技术若能模拟不同历史时期的城市与自然景观,将显著增强课堂的呈现力,是值得重点推进的方向。其次,在平台建设上,她强调数字史学初期往往面临重复搭建、分散投入等问题,如能统一建设学院层面的高质量服务器与数据库底座,由各研究方向按模块接入,将有效减少基础工作的重复、提升整体效率。最后,在跨学科合作方面,她认为历史学者与计算机技术团队保持持续、紧密沟通至关重要,既能明确需求,也能推动技术方案更贴近史学实际。整体而言,数字史学建设需在统一平台与协同机制下推进,以便让更多教师快速进入状态、形成合力。

孙晓璠老师发言围绕人工智能在考古与史学中的应用展开,指出当前个人实践多集中于文本识别与基础统计,但在教学与转化上仍有拓展空间。建议在学院现有课程框架下,与人工智能或计算机相关院系合作开设技术类课程,补足深度学习与计算机考古等能力。同时认为可结合南开在物质文化、环境史等领域的特色,尝试开发小型识别工具或虚拟课程,并将研究成果通过数字人、短视频等方式转化为公共传播内容,提升史学表达的吸引力与可见度。

张国文教授以先前参与壁画活化的经验为例,指出AI在史学中的应用目前多停留在影像化、科普化等轻量场景,但对学院确立数字史学定位仍具有参考价值。适度开展公共传播类的小项目,有助于提升认知度、验证方法,也便于探索适合南开的切入点。在资源方面,一些企业在文化遗产数字化领域投入充足,关键在于找准合作方向,使技术力量与学院研究优势形成互补。总体上,数字史学的推进仍需在定位明确后循序展开。

方万鹏副教授切身体会到数字史学的写作逻辑已经和几年前完全不同。早期大家的设想更多还是停留在“把史料做成数据库”“OCR 转文本”这样的思路,但现在的语料处理、智能体搭建、模型辅助分析已经改变了资料组织的方式,也让文本很难像过去那样按部就班地写。由此提出自己的疑惑:数字史学以后怎样在“技术不断更新”和“史学基本功不能动摇”之间找到平衡?哪些部分属于应该坚持的“底盘”,哪些部分需要不断跟着新工具去调整?

刘希洋副教授从自身使用大模型时的体验出发,指出通用模型的回答质量波动较大,更凸显建设“小而专”的专题语料库与定向智能体的必要性。专题化建设依赖高质量史料输入,前期筛选、清洗与标准化处理至关重要,否则难以形成可靠输出。为提高建设效率,可在项目推进中组建由教师、学生与企业技术人员共同参与的临时协作团队,以实现更紧密的沟通与更具针对性的功能设计。

郭子健副教授指出,当前史学研究在选题与公共关怀上与社会需求存在脱节,许多成果难以被公众、企业或政策部门有效吸收,史学公共性因此被压缩。在数字史学建设中,可依托共和国史在制度史、物质史、环境与卫生等领域的资料优势,推动专题语料库与智能检索工具的建设,为新议题提供方法支撑。同时,数字平台既可服务学术研究,也可与互联网企业、博物馆与企业史项目形成合作,通过高质量历史内容的生成和转化扩大影响力。

姬凌辉副教授结合近期在疫苗史、疾病与人口数据等研究中的经验,提出传统的统计分析难以呈现社会与制度层面的复杂结构,未来更需依托跨国、跨地区、跨语种的资料平台开展综合性比对。与此同时,大规模档案数字化在版权、使用权限与涉外查阅等方面可能面临法律与合规风险,数据库建设与项目规划中需提前考虑相应说明与规避机制。总体上,AI 赋能虽能显著提升史料处理与分析能力,但技术使用与档案规范之间的平衡也需同步纳入讨论。

医学院刘赵昆老师主要从实际教学与尝试性的技术使用谈到当前面临的困难。尽管在课堂上已允许学生使用大模型工具,但自身在搭建智能体、导入阅读材料等操作中仍受限于技术门槛,模型输出质量也难以满足学术需要。医学院已经配置工作站并由团队维护,为语料处理、模型运算和小型项目部署提供稳定环境。

学院党委书记翟明睿在总结发言中指出,本次研讨既体现了历史学界面对技术变革时的危机意识,也呈现出主动探索、敢于开新局的劲头。数字史学的实施需要明确分工:史学端负责提出问题、确定需求、保证学术判断;技术端负责具体实现与迭代。鉴于技术更新速度快,项目运行不以历史学者亲自掌握全部技术为目标,而以理解基本逻辑、保持学科判断力为核心。资源层面可依托校内算力平台或企业开放的技术渠道,同时通过竞赛、合作项目等方式建立高效接口。在制度建设方面,知识产权、数据合规与平台开放度被视为前期即需考虑的重要条件。项目推进需要工程化的组织方式,包括明确的时间表、进度管理机制、常态化组会与持续迭代。人才培养方面,更适合根据学院基础设计适配性的数字史学课程,而非照搬理工科训练路径。整体目标在于以稳固的史学底盘为基础,构建兼具创新性与可持续性的数字史学体系。