往期理论版阅读
更多
2021年10月下期
机器学习视域下网络舆情公开渠道精准化治理研究/曾关秀 胡 峰
来源:领导科学网,领导科学杂志社唯一网站
作者:曾关秀 胡 峰
日期:2021-11-17 17:23:18
配舆情公开渠道
半监督学习介于监督学习与无监督学习的中间带,通过抽取部分特征得出有效的舆情公开渠道预测结果。当突发网络舆情危机的部分特征与历史库某类舆情案例部分特征类似时,则可使用半监督学习模型。该模型在运算时,先通过抽取需要分析的舆情事件相关特征变量作为判断依据,再将少量已标注的与历史舆情事件相同特征和大量的新事件特征结合进行训练和分类,最终生成与该舆情事件的规律相对应的半监督机器学习模型,从而得出该舆情事件的信息公开渠道预测结果,有效地帮助管理部门进行科学决策。半监督学习的优点是使用少量的标记数据就可以达到较好的学习效果,降低了标注数据的成本。
总的来说,这三类学习算法主要是处理特定应用场景下的有效性分类问题,究其本质,就是寻找各种事物间的共同点和不同点,再基于相关特征变量对事物进行精准分类。
三、机器学习在舆情治理中的潜在风险防范
机器学习的应用和普及,有效提升了政府在公共管理方面的分析和决策能力,使执政更加科学化、系统化、现代化。这项技术给社会带来了巨大的进步,但在实际应用领域也不可避免地存在一些缺陷,因而在具体操作中要注意其短板与局限性,防止影响模型分类的准确性及决策的可行性,保障机器学习效用的发挥。
(一)健全指标体系,规范影响因子
不同类型的舆情事件各有特点,因而影响这些事件的因素也不尽相同。人工智能模型的设计通常是基于特定的训练样本,而样本的平衡性、范围都会对模型训练、泛化及实际应用效果产生影响。如果训练样本数据集的选择与总体数据的分布情况偏离较大,或者未能对实际问题中的影响因素考虑周全,这种偏离会在机器学习的过程中进一步放大,导致模型分类的结果难以符合总体的真实情况。[5]比如,自然灾害类舆情较为客观且易澄清,能通过自然灾害自身发展进程与政府处置过程进行有效的引导,但自然灾害类舆情相对于其他类型的舆情事件更加具有突发性、不确定性等特点,故影响自然灾害类舆情演变因素会与其他类型舆情演变的影响因素存在差异。一旦不能正确判断各类舆情的影响因素,那么分类模型也会得出错误的结论,从而引起舆情渠道预测的失误,使信息无法及时准确地传递给受众。因此,在实际模型设计与开发过程中,需要对各类舆情事件进行透彻分析,找出其内在变化中的重要驱动因素,正确把握各类因素间的内在联系,并将这些因素进行相关转化与量化,最终建立一套规范、科学、完整的舆情影响因素的指标体系,用以对不同类型的舆情事件公开渠道的有效性进行精准区分。
(二)提高规律认知,规避算法“黑匣子”
在公共治理数据分析和分类模型的开发过程中,除影响因素挖掘不足造成的偏误问题之外,还涉及机器学习算法自身的缺陷。如“黑匣子”性质就是神经网络存在的最典型的问题,即无从得知所搭建的神经网络分类模型分析的过程与产生该结果的原因。如果出现偏差,不仅得不到满意的结果,也无法找出错误分类的症结所在,从而产生了两点不足:一是无法确定问题出在哪里,这极有可能导致错将某些非影响因素误判为影响因素;二是无法根据错误分类结果找出模型缺陷。因此,在实际应用中,在明确某一舆情事件利用何种渠道进行信息公开的同 |