×

Loading...
Ad by
  • 推荐 OXIO 加拿大高速网络,最低月费仅$40. 使用推荐码 RCR37MB 可获得一个月的免费服务
Ad by
  • 推荐 OXIO 加拿大高速网络,最低月费仅$40. 使用推荐码 RCR37MB 可获得一个月的免费服务

@

【精华,导读】无知不可怕,可怕的是把无知当攻击手段 - Forum 选情统计的合理性。

本文发表在 rolia.net 枫下论坛俗话说,骂人要有修养。即便你利欲熏心,也要见龙在田潜龙勿用,才能振臂一呼万众响应。当你脸红耳赤强词夺理时,即便气势上占了上风,也是战略上落了下乘。

前几天围绕着Forum NDP以47%支持率领先的争吵也是如此。是的,你们没有看错,确实“总共调查了906人,准备投保守党的342人,投NDP的307人”。对这个有异议的,完全是出于个人的立场,为反保而反保。

但是,任何社会调查是建立在概率统计的基础上的,如果简单问卷精确,我们还要去投票干什么,不是劳民伤财么?这不是说民意调查就是胡扯,更不是说不符合大众期望个人感觉的结果就是作假。在误差范围置信区间内,民意调查还是有统计学意义的。

统计学意义其实并不在于“总共调查了906人,准备投保守党的342人,投NDP的307人”这样的简单数据和粗暴结论上。在统计学上,有一个非常基本的原理是样本的有效性。你如果只去我们街坊,唯一可能的结果就是某党占90%席位当选。可是这个采样是无效的。

样本越多,如果涵盖所有选民,那就100%是选举的结果,但这是不现实的,一般采样有1000人左右就可以代表民意了。但这个采样应该不是全在我们街坊,也不是某小众网站做内部调查。采样越是多样性,结果越是准确。然而,这个多样性不是每次都能保证的,也不能在采样过程中微调,这样就破坏了调查的随机性了。

为了保证调查中样本有效性,一个关键的概念就来了:【样本拟合】。

样本拟合能够过滤采样过程中的不均衡,在理论和经验模型里确定了解释变量后,根据变量进行加权,就能使这些部分不均衡的样本和一般人群分布曲线拟合,在这样的分布上计算出来的支持率,是最接近社会现实的。这也是所有权威统计机构都要用到的概念,并在这个基础上进行优化。exit poll不包括这个算法,因为一是隐私问题,二是样本足够大,足够均衡了。

所以,当你开始谩骂时,最好首先检查一下自己的修养和理解力。更多精彩文章及讨论,请光临枫下论坛 rolia.net
Sign in and Reply Report

Replies, comments and Discussions:

  • 枫下茶话 / 社会政治 / 【精华,导读】无知不可怕,可怕的是把无知当攻击手段 - Forum 选情统计的合理性。 +4
    本文发表在 rolia.net 枫下论坛俗话说,骂人要有修养。即便你利欲熏心,也要见龙在田潜龙勿用,才能振臂一呼万众响应。当你脸红耳赤强词夺理时,即便气势上占了上风,也是战略上落了下乘。

    前几天围绕着Forum NDP以47%支持率领先的争吵也是如此。是的,你们没有看错,确实“总共调查了906人,准备投保守党的342人,投NDP的307人”。对这个有异议的,完全是出于个人的立场,为反保而反保。

    但是,任何社会调查是建立在概率统计的基础上的,如果简单问卷精确,我们还要去投票干什么,不是劳民伤财么?这不是说民意调查就是胡扯,更不是说不符合大众期望个人感觉的结果就是作假。在误差范围置信区间内,民意调查还是有统计学意义的。

    统计学意义其实并不在于“总共调查了906人,准备投保守党的342人,投NDP的307人”这样的简单数据和粗暴结论上。在统计学上,有一个非常基本的原理是样本的有效性。你如果只去我们街坊,唯一可能的结果就是某党占90%席位当选。可是这个采样是无效的。

    样本越多,如果涵盖所有选民,那就100%是选举的结果,但这是不现实的,一般采样有1000人左右就可以代表民意了。但这个采样应该不是全在我们街坊,也不是某小众网站做内部调查。采样越是多样性,结果越是准确。然而,这个多样性不是每次都能保证的,也不能在采样过程中微调,这样就破坏了调查的随机性了。

    为了保证调查中样本有效性,一个关键的概念就来了:【样本拟合】。

    样本拟合能够过滤采样过程中的不均衡,在理论和经验模型里确定了解释变量后,根据变量进行加权,就能使这些部分不均衡的样本和一般人群分布曲线拟合,在这样的分布上计算出来的支持率,是最接近社会现实的。这也是所有权威统计机构都要用到的概念,并在这个基础上进行优化。exit poll不包括这个算法,因为一是隐私问题,二是样本足够大,足够均衡了。

    所以,当你开始谩骂时,最好首先检查一下自己的修养和理解力。更多精彩文章及讨论,请光临枫下论坛 rolia.net
    • 再说一句公道话, +3
      5/24的结果根据前后数次结果看,应该不是很有效的一次统计,因为即便模型能保证+-3%的准确率,但估计这次的样本相关性有问题,所以造成样本极端不均衡,出现无效拟合。但是,这绝对不是Forum故意所为,事后Forum也承认这是统计上的一个毛刺。我们保持平常心就能理解万岁,波澜不惊。
    • 很好的科普,谢谢。顺便问:前年美国大选前的那些民调,那么离谱,您觉得当时问题主要可能出在哪?
      • 美国的人口基数太大,加上选举制度特别,统计机构能做到不能做到都是正常的,做到的也就像是老玩家终于中了个大奖而已。 +2
        • 准确率像抽奖?那么我以最大的热情给与它10%的概率。换句话说,在美国对总统选举进行民调至少90%的概率是扯淡。再进一步,既然大家都觉得它是扯淡的东西,那就会有人玩弄它,而且甚至都不会损失自身信誉,对吗?因为本身就是扯淡。 +4
    • 短短几周时间有如此变化,这个民调显示保守党的福特非常不受欢迎,好好的一盘棋被下成一盘烂棋,如果让他上台,现在安省经济就业的大好形势很有可能也会成一盘烂棋,受影响的也许就是今日投福特票的华人,华人朋友们三思。 +6
      • 党魁还是很重要的,无论自由党还是保守党都吃了这个亏。NDP一直不在limelight下,党魁的负面影响没有被彰显出来。 +3
      • 福特是唯一一个非职业政客,懂经济,ndp上台才会把安省给害了 +3
        • 从小就懂。 +3
    • 保守党还没有花钱请水军;花自由党得钱拉“仇恨”,你们自求多福吧,过几天让你们哭。 +2
      • 水军多没劲,还是演员有用,看着也舒服。 +1
    • sailor,这个如何就变成精化和导读了?请出来解释一下。
      • .
      • 请问这篇文章哪里就不能上导读了? +3
      • 这不重要。精华,导读是我自封的,版主将计就计而已。
    • 人总是唯心的,由人组成的群当然也是唯心的,要不早打架打散了。唯心的人采用非全面的数据(什么叫全面什么叫客观?),又用了唯心的 Algorithm,自然结果也是唯心的。谩骂,和 sampling data sets 和 algorithm 都没关系。就是想喷,没啥不理解的,因为不需要理解。
    • 民调要有资金支持,没有资金支持民调,民调就不存在。谁出资金,民调就得回报谁。2016美国总统大选,多数民调支持希拉里,希拉里并没有因为民调当选美国总统。 +1
    • 还要啥数据啊?直接上算法得了。。。LOL,人有多大胆,地有多大产。。。 +5
    • 本次省选的民调,我猜测保守党支持率的数据大致是准确的,自由党和NDP 的民调数据不可能准确,因为这两党之间的摇摆选民很多,最后关头的弃保效应会如何谁都无法预测。 +1
    • 据可靠消息透露,福特集团将于2018年6月7日晚8点59分59秒,正式推出安省保守党竞选纲领完整版。请保守党人士熟记后再去投票。 +3
    • Forum 的民调就是个笑话。上次多市长选举,Forum 就造假说,邹女士在downtown 也输给John, 在ford 老巢John也大赢Ford。 +1
      • 不合我意的,又焉知非福?
      • 楼主已经说了:民调的准确度就像中奖,等于扯淡。
        • 学习不好是不是?