搜索到470 篇“ 主题建模 “的相关文章
基于动态聚类和词嵌入增强的短文本主题 建模 方法 本发明公开了一种基于动态聚类和词嵌入增强的短文本主题 建模 方法,首先通过收集短文本数据得到短文本流;再使用FastStream聚类方法对短文本流进行聚类并根据聚类结果构建伪文档;然后利用大型语料库预训练的词嵌入模型形成词嵌... 李树栋 曲春屹 吴晓波 方滨兴 姚明俊 张欣 冯依林 罗文伟一种联合情感和话语角色的在线论坛主题 建模 方法 本发明公开了一种联合情感和话语角色的在线论坛主题 建模 方法,首先,针对帖子的需要和相关分类方法确定帖子的各情感向量占比;其次,使用相关话语角色分类表分别确定发帖和回帖的各类角色向量的占比;第三,联合情感向量和回帖的角色向量... 张思 陈娟 徐佳丽 刘清堂一种结合BTM和Bi_LSTM模型的主题 建模 和文本预测方法 本发明提供一种结合BTM和Bi_LSTM模型的主题 建模 和文本预测方法,利用主题 注意力模型融合了Bi_LSTM和BTM模型,通过主题 注意力层的注意力机制,将Bi_LSTM学习到的序列信息和BTM提取出的主题 信息融合在一起,... 杨雪 马月明 吴煦然 陈卓 王刘安 史建伟 曾帅 王国泾科学文献主题 建模 方法及其效果评估研究 被引量:9 2024年 [背景/意义]研究和对比不同主题 建模 方法在科学文献主题 识别上的应用表现,对于合理选择使用主题 建模 技术开展科学文献主题 挖掘具有重要意义。[方法/过程]通过构建中英文科学文献实验语料,选择3种主题 建模 方法(LDA、Top2vec、Bertopic)和5种文本特征计算方法(Bag of Words、TFIDF、Doc2vec、MiniLM、SciBert)进行中英文科学文献主题 建模 实验,并对不同建模 结果的主题 多样性、主题 一致性、主题 稳定性和主题 离散性指标进行对比分析。[结果/结论]不同建模 工具的主题 识别结果存在较大差异,其中LDA与Bertopic在英文和中文语料上识别出的主题 中具有相似性关系的主题 占比相对较高,但也仅为9.81%和7.46%;基于Doc2vec算法的Top2vec模型在主题 多样性指标上的表现相对最优;基于文本预训练算法的Top2vec模型和Bertopic模型的主题 稳定性和离散性指标优于传统主题 建模 方法。针对大语言模型技术的快速发展和广泛应用,加快推进科学文献预训练模型研发,并将之应用于科技情报业务实践是当前的重要研究方向。 逯万辉关键词:主题建模 LDA 主题识别 一种基于多维度的主题 建模 评估方法及系统 本发明提供一种基于多维度的主题 建模 评估方法及系统,方法包括:使用LDA算法构建主题 模型;使用C_V算法计算主题 连贯性TC分数;计算主题 多样性TD分数;通过计算主题 建模 结果中的独特词占比,确定一组主题 之间的多样性;采用RB... 刘霄锋主题 建模 方法及装置、电子设备、存储介质 本申请提供了一种主题 建模 方法及装置、电子设备、计算机可读介质,属于数据处理技术领域。该方法包括:根据先验信息,确定待处理文本集的初始主题 分布,初始主题 分布包括待处理文本集中各个词汇的初始主题 ;根据初始主题 分布进行采样处理... 尹大渝 蒋宁 吴海英 曾琳铖曦一种基于主题 建模 和深度学习的推荐方法及装置 本申请的实施例提供了一种基于主题 建模 和深度学习的推荐方法及装置。该方法包括:收集高新技术产业增加值D1,高新技术企业数量和销售收入D2,研发经费投入总额D3,科技专利申请、授权和作者D4,国家发展规划信息D5,D1‑D4... 张兆斌 伍人仁 舒歆 于红艳一种联合行为-情感-时序的在线论坛主题 建模 方法 本发明公开了一种联合行为‑情感‑时序的在线论坛主题 建模 方法。包括对个人的发帖文本进行情感、行为、主题 和时间挖掘。首先,针对帖子和个人情感确定帖子的情感向量占比;依据相关行为分类规则获取行为向量占比;将情感向量与行为向量联... 张思 陈娟 夏丹 高倩倩一种基于软提示主题 建模 的抑郁情绪检测方法及系统 本发明公开了一种基于软提示主题 建模 的抑郁情绪检测方法及系统,属于情绪检测技术领域,包括:第一步,将每个样本的对话转录文本按照预定义的k个主题 分割成若干个小片段。第二步,首先修改BERT模型的Embedding层,当文本片... 郭艳蓉 刘积隆 郝世杰 洪日昌基于语料库的区域国别研究——以“一带一路”中美主流媒体报道主题 建模 分析为例 2024年 作为交叉学科,区域国别研究发展迅速、成果显著,但对量化研究方法的运用仍有待深化。该研究以中美四大主流媒体关于“一带一路”的报道为例,运用主题 建模 技术进行案例分析,展示了语料库和自然语言处理技术在区域国别研究中的应用。研究结果显示,中国媒体强调“发展”“互利”“合作”等正面话题,体现了“一带一路”倡议的核心价值与目标;美国媒体则倾向于突出“安全”“风险”“挑战”等负面话题,呈现出批判甚至抹黑的态度。这种差异可能与两国的“国家利益”“经济利益”“意识形态”等因素紧密相关。 李德凤 吴侃关键词:语料库 主题建模
相关作者
吴飞 作品数:597 被引量:3,364 H指数:27 供职机构:浙江大学 研究主题:人工智能 跨媒体 视频 网络 文本 王友翠 作品数:17 被引量:81 H指数:5 供职机构:哈尔滨医科大学图书馆 研究主题:主题建模 图书馆管理 图书馆事业 图书馆 网络舆情 夏晨曦 作品数:29 被引量:130 H指数:6 供职机构:华中科技大学同济医学院医药卫生管理学院 研究主题:主题建模 文本分类 主题模型 患者投诉 中文 汤斯亮 作品数:77 被引量:26 H指数:3 供职机构:浙江大学 研究主题:跨媒体 文档 文本 文本数据 层次化 邵健 作品数:92 被引量:99 H指数:6 供职机构:浙江大学 研究主题:跨媒体 哈希索引 哈希 抽取方法 跨媒体检索