搜索到470篇“ 主题建模“的相关文章
基于动态聚类和词嵌入增强的短文本主题建模方法
本发明公开了一种基于动态聚类和词嵌入增强的短文本主题建模方法,首先通过收集短文本数据得到短文本流;再使用FastStream聚类方法对短文本流进行聚类并根据聚类结果构建伪文档;然后利用大型语料库预训练的词嵌入模型形成词嵌...
李树栋曲春屹吴晓波方滨兴姚明俊张欣冯依林罗文伟
一种联合情感和话语角色的在线论坛主题建模方法
本发明公开了一种联合情感和话语角色的在线论坛主题建模方法,首先,针对帖子的需要和相关分类方法确定帖子的各情感向量占比;其次,使用相关话语角色分类表分别确定发帖和回帖的各类角色向量的占比;第三,联合情感向量和回帖的角色向量...
张思陈娟徐佳丽刘清堂
一种结合BTM和Bi_LSTM模型的主题建模和文本预测方法
本发明提供一种结合BTM和Bi_LSTM模型的主题建模和文本预测方法,利用主题注意力模型融合了Bi_LSTM和BTM模型,通过主题注意力层的注意力机制,将Bi_LSTM学习到的序列信息和BTM提取出的主题信息融合在一起,...
杨雪马月明吴煦然陈卓王刘安史建伟曾帅王国泾
科学文献主题建模方法及其效果评估研究被引量:9
2024年
[背景/意义]研究和对比不同主题建模方法在科学文献主题识别上的应用表现,对于合理选择使用主题建模技术开展科学文献主题挖掘具有重要意义。[方法/过程]通过构建中英文科学文献实验语料,选择3种主题建模方法(LDA、Top2vec、Bertopic)和5种文本特征计算方法(Bag of Words、TFIDF、Doc2vec、MiniLM、SciBert)进行中英文科学文献主题建模实验,并对不同建模结果的主题多样性、主题一致性、主题稳定性和主题离散性指标进行对比分析。[结果/结论]不同建模工具的主题识别结果存在较大差异,其中LDA与Bertopic在英文和中文语料上识别出的主题中具有相似性关系的主题占比相对较高,但也仅为9.81%和7.46%;基于Doc2vec算法的Top2vec模型在主题多样性指标上的表现相对最优;基于文本预训练算法的Top2vec模型和Bertopic模型的主题稳定性和离散性指标优于传统主题建模方法。针对大语言模型技术的快速发展和广泛应用,加快推进科学文献预训练模型研发,并将之应用于科技情报业务实践是当前的重要研究方向。
逯万辉
关键词:主题建模LDA主题识别
一种基于多维度的主题建模评估方法及系统
本发明提供一种基于多维度的主题建模评估方法及系统,方法包括:使用LDA算法构建主题模型;使用C_V算法计算主题连贯性TC分数;计算主题多样性TD分数;通过计算主题建模结果中的独特词占比,确定一组主题之间的多样性;采用RB...
刘霄锋
主题建模方法及装置、电子设备、存储介质
本申请提供了一种主题建模方法及装置、电子设备、计算机可读介质,属于数据处理技术领域。该方法包括:根据先验信息,确定待处理文本集的初始主题分布,初始主题分布包括待处理文本集中各个词汇的初始主题;根据初始主题分布进行采样处理...
尹大渝蒋宁吴海英曾琳铖曦
一种基于主题建模和深度学习的推荐方法及装置
本申请的实施例提供了一种基于主题建模和深度学习的推荐方法及装置。该方法包括:收集高新技术产业增加值D1,高新技术企业数量和销售收入D2,研发经费投入总额D3,科技专利申请、授权和作者D4,国家发展规划信息D5,D1‑D4...
张兆斌伍人仁舒歆于红艳
一种联合行为-情感-时序的在线论坛主题建模方法
本发明公开了一种联合行为‑情感‑时序的在线论坛主题建模方法。包括对个人的发帖文本进行情感、行为、主题和时间挖掘。首先,针对帖子和个人情感确定帖子的情感向量占比;依据相关行为分类规则获取行为向量占比;将情感向量与行为向量联...
张思陈娟夏丹高倩倩
一种基于软提示主题建模的抑郁情绪检测方法及系统
本发明公开了一种基于软提示主题建模的抑郁情绪检测方法及系统,属于情绪检测技术领域,包括:第一步,将每个样本的对话转录文本按照预定义的k个主题分割成若干个小片段。第二步,首先修改BERT模型的Embedding层,当文本片...
郭艳蓉刘积隆郝世杰洪日昌
基于语料库的区域国别研究——以“一带一路”中美主流媒体报道主题建模分析为例
2024年
作为交叉学科,区域国别研究发展迅速、成果显著,但对量化研究方法的运用仍有待深化。该研究以中美四大主流媒体关于“一带一路”的报道为例,运用主题建模技术进行案例分析,展示了语料库和自然语言处理技术在区域国别研究中的应用。研究结果显示,中国媒体强调“发展”“互利”“合作”等正面话题,体现了“一带一路”倡议的核心价值与目标;美国媒体则倾向于突出“安全”“风险”“挑战”等负面话题,呈现出批判甚至抹黑的态度。这种差异可能与两国的“国家利益”“经济利益”“意识形态”等因素紧密相关。
李德凤吴侃
关键词:语料库主题建模

相关作者

吴飞
作品数:597被引量:3,364H指数:27
供职机构:浙江大学
研究主题:人工智能 跨媒体 视频 网络 文本
王友翠
作品数:17被引量:81H指数:5
供职机构:哈尔滨医科大学图书馆
研究主题:主题建模 图书馆管理 图书馆事业 图书馆 网络舆情
夏晨曦
作品数:29被引量:130H指数:6
供职机构:华中科技大学同济医学院医药卫生管理学院
研究主题:主题建模 文本分类 主题模型 患者投诉 中文
汤斯亮
作品数:77被引量:26H指数:3
供职机构:浙江大学
研究主题:跨媒体 文档 文本 文本数据 层次化
邵健
作品数:92被引量:99H指数:6
供职机构:浙江大学
研究主题:跨媒体 哈希索引 哈希 抽取方法 跨媒体检索