基于词嵌入技术的心理学研究:方法及应用 |
| |
引用本文: | 包寒吴霜,王梓西,程曦,苏展,杨盈,张光耀,王博,蔡华俭.基于词嵌入技术的心理学研究:方法及应用[J].心理科学进展,2023(6):887-907. |
| |
作者姓名: | 包寒吴霜 王梓西 程曦 苏展 杨盈 张光耀 王博 蔡华俭 |
| |
作者单位: | 1. 中国科学院心理研究所行为科学重点实验室;2. 中国科学院大学心理学系;3. 英国曼彻斯特大学曼彻斯特中国研究院;4. 北京师范大学认知神经科学与学习国家重点实验室和IDG/麦戈文脑科学研究院;5. 天津大学智能与计算学部 |
| |
基金项目: | 国家社会科学基金重大项目“中国社会变迁过程中的文化与心理变化”(17ZDA324); |
| |
摘 要: | 词嵌入是自然语言处理的一项基础技术。其核心理念是根据大规模语料中词语和上下文的联系,使用神经网络等机器学习算法自动提取有限维度的语义特征,将每个词表示为一个低维稠密的数值向量(词向量),以用于后续分析。心理学研究中,词向量及其衍生的各种语义联系指标可用于探究人类的语义加工、认知判断、发散思维、社会偏见与刻板印象、社会与文化心理变迁等各类问题。未来,基于词嵌入技术的心理学研究需要区分心理的内隐和外显成分,深化拓展动态词向量和大型预训练语言模型(如GPT、BERT)的应用,并在时间和空间维度建立细粒度词向量数据库,更多开展基于词嵌入的社会变迁和跨文化研究。我们为心理学专门开发的R语言工具包PsychWordVec可以帮助研究者利用词嵌入技术开展心理学研究。
|
关 键 词: | 自然语言处理 词嵌入 词向量 语义表征 语义关联 词嵌入联系测验 |
|
|