【喜訊】學院教師獲批2023年度國家社科基金項目

發布者：永利發布時間：2023-09-19浏覽次數：194

9月4日，全國哲學社會科學工作辦公室發布了《關于2023年國家社科基金年度項目和青年項目立項名單的公示》，學院教師文玉鋒喜獲國家社科基金一般項目。

文玉鋒老師獲批的“古籍文本挖掘與知識計算研究”項目，旨在以數字人文為研究視角，借助于自然語言處理等先進信息技術，立足于申請人所在團隊針對古籍文獻知識組織和數字人文研究所取得的前期研究成果，以及本團隊前期已開發的方法與工具，圍繞古籍文獻文本挖掘與知識計算對古籍整理展開深入研究，為“文史互證”學術理想和“辨章學術，考鏡源流”學術傳統在更大範圍内的落地實踐探索新的解決方案。

課題的主要研究内容有以下幾個方面：（1）古籍文獻語料庫建設及前沿技術導入。按照經、史、子、集四部，依托課題組所在機構的豐富館藏，對拟納入研究的古籍文獻進行系統梳理，初步建成拟分析的古籍文獻語料庫；（2）古籍文獻文本挖掘。使用Python擴展庫Jiayan（甲言）、networkx、plotly、dash、pyechartst等工具，借助隐馬爾可夫模型，結合TextRank、TF-IDF等算法，對語料庫中所涉及文獻進行分詞、去停、模糊詞識别和剔除，構建人物關聯矩陣和事件關聯矩陣以及人物、事件二模網絡并對其進行可視化表征，對文獻中的人物、事件的序時進行可視化表征；（3）古籍文獻知識計算。基于齊普夫定律，使用AntConc、WordSmith ToolsUcinet、TextRank等工具，進行詞頻統計、識别高低詞頻、處理同頻詞；進行高、中、低頻率的人物、事件關系網絡特征解析，并結合二模網絡和序時結構，探究人物和事件之間的關系，以全面解析古籍文獻的知識體系和曆史背景；（4）古籍文獻知識要素分析的指标體系與理論特性。使用Stata軟件、Python-Statsmodels庫，結合Latent Dirichlet Allocation和Non-negative Matrix Factorization等算法，構建古籍文獻知識要素分析的指标體系，實現對古籍文獻知識組織基礎理論的發展。

該課題着眼于古籍文獻内容挖掘與知識要素提取，從而既傳承和吸納了本領域相關研究的最新成果，又實現了對本領域現有研究的補充和完善，其獨特的研究價值具體表現在：着眼于詞語級别的古籍文獻挖掘，從而使古籍文獻數字化建設工作深入到了内容維度；着眼于構建古籍文獻知識計算的指标體系，從而為基于大數據的“文史互證”探索了新的路徑。

學院一直高度重視國家社科基金項目申報與管理工作，積極發揮學術團隊作用，特别是“三抓三促”行動開展以來，學院不斷激發教師科研項目培育工作，切實做好國家級項目的摸底、動員、組織、論證、評審等基礎工作，為提高學院教師國家級立項率打下了堅實的基礎。

撰稿人：薄慧敏

審稿人：和蘇超

【喜訊】學院教師獲批2023年度國家社科基金項目

最近新聞

學術資訊