2022年深圳杯A题破除“尖叫效应”与“回声室效应”走出“信息茧房”

2023-11-18

2022年深圳杯A题破除“尖叫效应”与“回声室效应”走出“信息茧房”
  为了防止更多的人走弯路,对于此题,数据随便找,数据自己造然后文档写的时候数据来源说数据爬取这样不就ok了,题里不是还写着了么“等社交媒体的数据”。你考虑过么?你在写文档的时候你写数据爬取没毛病,至于实际数据怎么来的评判老师是名侦探柯南么?他会查么?只要符合社会价值观和导向那就是OK的。
  其二,这个尖叫效应和回声室效应、信息茧房的形成跟层次分析法有什么关系?为什么好多人问我这个问题?这个题跟层次分析和什么熵权有什么关系呢?这不典型的鼓掌效应、知了鸣叫的数学模型的改动模型么。还有一点,面包多上的复制粘贴你就不必让我来评判做的好不好了,面包多上的不要买,你看看评价好么?那模型跟解这个题有关系么?至于我写的好不好,评论区我不限制交流。

一.背景与意义

  “尖叫效应”是心理学中的一个著名效应。例如在一个人潮涌动的公众场合,如果有人突然歇斯底里地尖叫,往往能快速吸引人们的注意力并博取眼球。在网络信息传播中,“尖叫效应”也无处不在。一些网络平台利用大数据和人工智能,获取并分析用户浏览记录和兴趣爱好等信息,大量推送段子、恶搞、色情等低俗内容。无论是从满足人们的猎奇心理,还是引发人们的指责批评,传播者都能从中获取高额的流量和点击率。

  “回声室效应”指的是在一个相对封闭的媒体环境中,一些意见相近的声音不断重复,甚至夸张扭曲,令处于其中的大多数人认为这些声音就是事实的全部, 不知不觉中窄化自己的眼界和理解,走向故步自封甚至偏执极化。在现代社会中,由于互联网以及社交媒体的发展,在网络信息传播中“回声室效应”愈发明显。部分商业网站会分析记录用户的搜寻结果以及使用习惯,持续地将一位用户所喜欢的内容提供给该用户,导致一个人在同一网站中接受到的资讯被局限于某个范围内。

  “尖叫效应”与“回声室效应”容易导致“信息茧房”的形成。所谓“信息茧房”指的是,在信息传播中人们自身的信息需求并非全方位的,只会选择自己想要的或能使自己愉悦的信息,久而久之接触的信息就越来越局限,最终将自己桎梏于像蚕茧一般的“茧房”中,失去对其他不同信息的了解能力和接触机会。

二.需回答的问题

  在全新的信息传播格局下,如何破除“尖叫效应”与“回声室效应”,走出“信息茧房”,是当前迫切需要解决的现实问题,即如何从信息传输的顶层设计、推荐算法的公平性和广大网络用户的责任担当等方面,帮助公众对新闻事件乃至社会现实有一个相对准确、清晰的认识和判断,并在主流意识和个性化信息之间找到平衡点,使得网络舆论环境更具理性和建设性。请回答以下问题:
  1. 针对某些话题,在微信、微博、Facebook 和 Twitter 等社交媒体上下载相关数据,定量描述该话题(或信息)的传播过程,并分析其影响因素。该数据分析需至少针对两种不同的话题展开讨论,其中一个话题最终观点趋于相同(中立共识),另一话题最终观点趋于两极分化(观点极化)。
  2. 建立数学模型刻画中立共识和观点极化的产生机制,探索“尖叫效应”、“回声室效应”与“信息茧房”的形成机制,并讨论话题的吸引度、用户的活跃度、用户心理、不同用户间的相互影响、平台推荐算法等因素对形成这些现象的影响。
  3. 根据问题 2 建立的数学模型,制定破除“尖叫效应”和“回声室效应”、规避“信息茧房”的策略。
  4. 基于上述数据分析与数学模型,针对如何破除“信息茧房”撰写 1~2 页报告,分别对政府的顶层设计、主流媒体的引领和广大网络用户的责任担当提出相应的解决方案或建议。

三.数据来源
  1. 参考数据: 爬取的数据是在社交网站 reddits 上话题中含有关于堕胎(abortion)和枪支管控(gun control)部分话题(submissions)的内容以及评论(comments)。(也可自己爬取相应的数据 ,如 2 ,3)
  2. 微信、微博、Facebook 和 Twitter 等社交媒体的原始数据
  3. 新闻媒体的标签数据库(MBFC)(https://mediabiasfactcheck.com)

在这里插入图片描述
图1 尖叫效应示例图

在这里插入图片描述

图2 回声室效应示例图

在这里插入图片描述
图3 信息茧房示例图

问题分析及模型的建立与求解

  问题一分析:
  我在此处举两个例子:
  例子1
  比如说一首音乐,有的人觉得好听,有的人觉得真难听好土,还有的人说还可以但是某些方面需要加强;
1) 使用调查问卷来获取评论者们是否为具有音乐专业知识的人员;
2) 使用调查问卷来获取评论者们的喜好音乐的风格;
3) 使用调查问卷来获取评论者们是否为该音乐发布者的粉丝,是黑粉还是真的粉丝;
4) 评论内容信息是否有关于该音乐的真实有效信息。(比如说演奏音乐这相貌美丽性感出奇,而评论者内容与音乐本身不符的情况)。
从这四个角度出发进行,得到褒奖、贬低、中立的占比情况(环形图)及影响关系拟合曲线图,这四个因素权重占比最大的是哪个?会得出哪些具体结论?比如说这个演奏者本身不是音乐爱好者或非专业音乐人,只是通过该音乐获取流量博人眼球则贬低和中立评论占比较大;如果该演奏者具有专业音乐知识及爱好音乐,目的为让大家欣赏音乐,则褒奖和中立评论占比较大。

例子2
男子跪地求复合 这种社会客观存在事实
评论区依然是三边说 一男生是舔狗 男生好极端 男生好不要脸 人在舔中不知舔 回首已是犬中犬
二 女生好绝情 为该女生不值得
三 男生没必要 好聚好散 女生和好吧
1) 使用调查问卷来获取评论者们的年龄;
2) 使用调查问卷来获取评论者们的感情经历是否经历过爱情;
这就是一个二分类数据:是 否
3) 使用调查问卷来获取评论者们的学历水平;
比如说小学 初中 高中 本科 大学 硕士 博士
4) 使用调查问卷来获取评论者们的性别;
5) 使用调查问卷来获取评论者们的经济水平。
比如说分层次: 4k以下 4k到6k 6k到8k 8k以上
从这5个角度出发进行,得到支持男方、女方、中立的占比情况(环形图)及影响关系拟合曲线图,这5个因素权重占比最大的是哪个?会得出哪些具体结论?比如说针对男青年,可能支持男方和中立评论占比较大;针对高学历经济水平高的人群,则中立评论占比较大。

数据可视化 该怎么做你们应该都知道
分类数据词云图像学历水平 数值数据看趋势就拟合曲线 看整体就直方图 看比例就饼形图 你如果觉得饼形图不好看你就做环形图

至于这些效应的程序代码:
我就随便给个demo你品一品 这题用什么算法去解

clear;
clc;
tic
a = 'hehe.jpg';
x=imread(a);
a=rgb2gray(x);
count=imhist(a);
[m,n]=size(a);
N=m*n;
L=256;
count=count/N;
u0=0;
u=0;
for i=1:L
    u0=u0+(i-1)*count(i);
    w(i)=sum(count(1:i));  %w(i)是前i个像素的累加概率
    u = u + (i-1)*count(i);
    ua(i)= u;
end
%-----(1)初始化参数-----
p = 2;    % 搜索范围的维度
BacterialNum = 20;   % 细菌的个数
Nc = 30;  %趋化的次数(Number of Chemotaxis steps)
Ns = 4;   %趋化操作中单向运动的最大步数(Number of Swimming steps)
Nre = 4;    %复制操作步骤数(Number of reproduction steps)
step=0.05; %翻转选定方向后,单个细菌前进的步长
Sr = BacterialNum/2;   %每代复制(分裂)数
range = 255; 
for i = 1:BacterialNum     % 产生初始细菌个体的位置 
    Bacterial(i).location = range * rand(1,p);
end
%------先计算各个细菌的适应度,并初始化Pbest----------------------
for i=1:BacterialNum
    Bacterial(i).bestFitness = CalFitness1(Bacterial(i).location,w,ua,u0);
    Bacterial(i).bestLocation = Bacterial(i).location;
end

    %-----(2)复制操作开始-----
    for k = 1:Nre   
        %-----(3)趋化操作(翻转或游动)开始-----
        for j = 1:Nc  
            %-----对每一个细菌分别进行以下操作-----
            for i = 1:BacterialNum
                %-----(3a)计算适应度值
                Bacterial(i).fitness = CalFitness1(Bacterial(i).location,w,ua,u0);
                %-----保存细菌目前的适应度值,直到找到更好的适应度值取代之-----
                Bacterial_last = Bacterial(i);
                %-----(3b)翻转,产生一个随机向量,代表翻转后细菌的方向-----
                Delta = rands(1,p);
                % PHI表示翻转后选择的一个随机方向上前进(单位向量)
                PHI = Delta/sqrt(Delta*Delta');
                %-----(3c)移动,向着翻转后细菌的方向移动一个步长,并且改变细菌的位置-----
                Bacterial(i).location = Bacterial(i).location + step*PHI;
                %-----计算细菌当前位置的适应度值-----
                Bacterial(i).fitness = CalFitness1(Bacterial(i).location,w,ua,u0);
                %-----(3d)游动-----
                m = 0; % 给游动长度计数器赋初始值
                while(m < Ns) % 未达到游动的最大长度,则循环
                    m = m + 1;
                    % 新位置的适应度值是否更好?如果更好,将新位置的适应度值存储为细菌i目前最好的适应度值
                    if Bacterial(i).fitness < Bacterial_last.fitness 
                        Bacterial_last = Bacterial(i);  %保存更好的适应度值
                        % 在该随机方向上继续游动步长单位,修改细菌位置
                        Bacterial(i).location = Bacterial(i).location + step*PHI;
                        % 重新计算新位置上的适应度值
                        Bacterial(i).fitness = CalFitness1(Bacterial(i).location,w,ua,u0);
                    else
                        % 否则,结束此次游动
                        m = Ns;
                        Bacterial(i) = Bacterial_last; % 更新趋化操作后的适应度值
                    end
                end
                % pbest
                if Bacterial(i).fitness < Bacterial(i).bestFitness  
                    Bacterial(i).bestFitness = Bacterial(i).fitness;
                    Bacterial(i).bestLocation = Bacterial(i).location;
                end
            end  % 如果i<BacterialNum,进入下一个细菌的趋化,i=i+1
            
          %--------Mutation with pfPSO Opreator-------------
            GlobalBest= Bacterial(1);
            for i=2:BacterialNum
                if Bacterial(i).fitness < GlobalBest.fitness;
                    GlobalBest = Bacterial(i);
                end
            end
            for i=1:BacterialNum
               r1=rand();
               r2=rand();
               Bacterial(i).location = ( 1 - GlobalBest.location / Bacterial(i).location ) * r1 * GlobalBest.location + (GlobalBest.location / Bacterial(i).location ) * r2 * Bacterial(i).bestLocation;
               Bacterial(i).fitness = CalFitness1(Bacterial(i).location,w,ua,u0);  
               Bacterial(i).location = mod(Bacterial(i).location,255)+1;
            end
        end %-----(4)如果j<Nc,此时细菌还处于活跃状态,进行下一次趋化,j=j+1-----
        function fun = CalFitness1(x,w,ua,u0)
L=256;
x=int16(mod(x,255))+1;
w1=w(x(1));
u1=ua(x(1))/w1;
w2=w(x(2))-w(x(1));
u2=(ua(x(2))-ua(x(1)))/w2;
w3=w(L)-w(x(2));
u3=(ua(L)-ua(x(2)))/w3;

通过调查问卷,我们收集的部分数据如附件.xlsx所示
  由于数据没有归类,且男性数据普遍较少,我们先进行女性数据的划分
我们将28岁以下,有感情经历的女性定义为有感情经历的女青年
将32岁以上,有感情经历的女性定义为中年女性。同时为了有所区分,我们多增加了一项指标婚姻状况来划分,从所得数据中可以看出中年未婚女性与已婚女性看法近似一致
将28岁以下,没有感情经历的女性定义为无感情经历的女青年
我们将数据分别提取出来,分别以年龄与经济收入绘制拟合曲线图,同时绘制各学历占比环形统计图
年龄和收入曲线图给我们一种更直观地去分析经济独立与看法的关系,同时环形图与饼状图可以更好给出,不同年龄段女性的学历水平,从而可以站在一个更好的角度去分析知识水平对此现象看法的影响

数学公式在这里不给出了
在这里插入图片描述
在这里插入图片描述
  没感情经历的女生反而更容易恋爱脑,我们收集的数据中,这类女生的工资收入还可以,但年龄较低。在这样的条件下,她们不会轻易去更换自己的伴侣,希望通过调解去缓和这段关系,并且也不愿意过多伤害男方,通过分析可知有60%的人选择支持(同情男方)。
由于经济收入数据相对较少,且差距不算大,分析效果不是很明显。所以我们又分别绘制了她们各自的圆环、饼状图,更好地看出占比关系,从而得到更加精确的结论。

在这里插入图片描述
在这里插入图片描述

  针对男青年,支持男方和中立评论占比较大;针对高学历经济水平高的人群,则中立评论占比较大;针对中年有感情经历女性,则支持女方评论占比较大。
针对于该感情纠纷话题,支持不同方的影响因素主要为年龄、是否有感情经历、性别、学历、经济收入,对于不同的人群,他们的观点见解也不一致。

问题二怎么处理呢?

  “信息茧房”的形成是平台通过推荐算法不断地从用户中数据挖掘相似的阅读规律导致的,并以“朋友圈”进行推荐,致使每个“圈”内的用户彼此志趣相投。
理想化准则:
  (1)算法中的所有信息传递者都不分性别、年龄及其他因素,即信息传递者之间的吸引只基于信息内容,不考虑性别的影响。

  (2)信息与信息被吸引者之间的吸引力和信息热度成正比,信息热度越大,吸引力越强。且两者都将随着时间的推逝而减小。因此对于任意信息传递者,不了解该信息的信息读者会向热度大的信息移动,热度最大的信息将随机移动。

  (3)信息的热度与待优化目标函数的值有关。
由于信息传递范围的增加和读者对信息的吸收,信息i的热度会随着距离r的增加而增大而非减小。为了对信息与读者之间的相互吸引力进行建模,这里首先给出信息绝对热度和相对热度的定义。
假设目前有M个信息读者,共有N条信息。信息读者与信息的关系如下图所示:
在这里插入图片描述
在这里插入图片描述

问题三四模型的建立与求解:

  制定破除“尖叫效应”和“回声室效应”、规避“信息茧房”的策略。
针对破除“尖叫效应”和“回声室效应”的策略:
(1) 在某一信息点击量或访问量达到一定的条件时,应加入信息审核算法,判别该信息是否符合正确的社会价值观引导;
(2) 使用关键词库判别发布的信息是否含有夸大虚拟词汇,与现实不符;
(3) 使用文本分类算法,如段子、色情、恶搞等低俗内容将尖叫效应下获得的流量信息标签,限制其发布;
(4) 对于非原创作者发布的相同类似信息进行限制流量处理。
还写了好多的策略 这里就不一一写了 大家都会写 篇幅我这里就不写太长了
在这里插入图片描述

A题的解题过程就全部写完了 接下来看看C题的难度如何

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

2022年深圳杯A题破除“尖叫效应”与“回声室效应”走出“信息茧房” 的相关文章

  • 如何在刻度标签和轴之间添加空间

    我已成功增加刻度标签的字体 但现在它们距离轴太近了 我想在刻度标签和轴之间添加一点呼吸空间 如果您不想全局更改间距 通过编辑 rcParams 并且想要更简洁的方法 请尝试以下操作 ax tick params axis both whic
  • 使用 openCV 对图像中的子图像进行通用检测

    免责声明 我是计算机视觉菜鸟 我看过很多关于如何在较大图像中查找特定子图像的堆栈溢出帖子 我的用例有点不同 因为我不希望它是具体的 而且我不确定如何做到这一点 如果可能的话 但我感觉应该如此 我有大量图像数据集 有时 其中一些图像是数据集的
  • 如何使用固定的 pandas 数据框进行动态 matplotlib 绘图?

    我有一个名为的数据框benchmark returns and strategy returns 两者具有相同的时间跨度 我想找到一种方法以漂亮的动画风格绘制数据点 以便它显示逐渐加载的所有点 我知道有一个matplotlib animat
  • 导入错误:没有名为 _ssl 的模块

    带 Python 2 7 的 Ubuntu Maverick 我不知道如何解决以下导入错误 gt gt gt import ssl Traceback most recent call last File
  • 如何在 Sublime Text 2 的 OSX 终端中显示构建结果

    我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它 让我困扰的一件事是默认的构建结果显示在 ST2 的底部 我的程序产生一些很长的结果 显示它的理想方式 如在 TM2 中 是并排查看它们 如何在 Mac 操作系统
  • 如何使用 Scrapy 从网站获取所有纯文本?

    我希望在 HTML 呈现后 可以从网站上看到所有文本 我正在使用 Scrapy 框架使用 Python 工作 和xpath body text 我能够获取它 但是带有 HTML 标签 而且我只想要文本 有什么解决办法吗 最简单的选择是ext
  • 打破嵌套循环[重复]

    这个问题在这里已经有答案了 有没有比抛出异常更简单的方法来打破嵌套循环 在Perl https en wikipedia org wiki Perl 您可以为每个循环指定标签 并且至少继续一个外循环 for x in range 10 fo
  • __del__ 真的是析构函数吗?

    我主要用 C 做事情 其中 析构函数方法实际上是为了销毁所获取的资源 最近我开始使用python 这真的很有趣而且很棒 我开始了解到它有像java一样的GC 因此 没有过分强调对象所有权 构造和销毁 据我所知 init 方法对我来说在 py
  • 在循环中每次迭代开始时将变量重新分配给原始值(在循环之前定义)

    在Python中 你使用 在每次迭代开始时将变量重新分配给原始值 在循环之前定义 时 也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
  • 从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

    我有一个清单 things A1 B2 C3 我有一个 pandas 数据框 其中有一列包含用分号分隔的值 某些行将包含与上面列表中的一项的匹配 它不会是完美的匹配 因为它在其中包含字符串的其他部分 该列 例如 该列中的一行可能有 哇 这里
  • NameError:名称“urllib”未定义”

    CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
  • python 集合可以包含的值的数量是否有限制?

    我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个 这个数字会随着时间的推移慢慢增长 我担心python集的最大容量 它可以包含的元素数量有限制吗 您最大
  • Geopandas 设置几何图形:MultiPolygon“等于 len 键和值”的 ValueError

    我有 2 个带有几何列的地理数据框 我将一些几何图形从 1 个复制到另一个 这对于多边形效果很好 但对于任何 有效 多多边形都会返回 ValueError 请指教如何解决这个问题 我不知道是否 如何 为什么应该更改 MultiPolygon
  • 表达式中的 Python 'in' 关键字与 for 循环中的比较 [重复]

    这个问题在这里已经有答案了 我明白什么是in运算符在此代码中执行的操作 some list 1 2 3 4 5 print 2 in some list 我也明白i将采用此代码中列表的每个值 for i in 1 2 3 4 5 print
  • HTTPS 代理不适用于 Python 的 requests 模块

    我对 Python 还很陌生 我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品 我的代码如下 import requests import json import os import urllib impor
  • 如何将 numpy.matrix 提高到非整数幂?

    The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
  • Python:尝试检查有效的电话号码

    我正在尝试编写一个接受以下格式的电话号码的程序XXX XXX XXXX并将条目中的任何字母翻译为其相应的数字 现在我有了这个 如果启动不正确 它将允许您重新输入正确的数字 然后它会翻译输入的原始数字 我该如何解决 def main phon
  • Python 3 中“map”类型的对象没有 len()

    我在使用 Python 3 时遇到问题 我得到了 Python 2 7 代码 目前我正在尝试更新它 我收到错误 类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
  • 在Python中重置生成器对象

    我有一个由多个yield 返回的生成器对象 准备调用该生成器是相当耗时的操作 这就是为什么我想多次重复使用生成器 y FunctionWithYield for x in y print x here must be something t
  • 使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

    我有一个 Pandas 数据框 它有两列 一列 进程参数 列 包含字符串 另一列 值 列 包含相应的浮点值 我需要过滤出部分匹配列 过程参数 中的一组键的子数据帧 并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce

随机推荐