合作咨询热线:

400-671-6258

新闻中心
联系世界杯买球

电话:400-671-6258

邮箱:62748190@qq.com

地址:江苏省江苏省宿迁市

您当前位置:世界杯买球 > 新闻中心 > 行业动态 >
记者手札:一世界杯买球篇时政数据报道的真实生产过程
发布时间:2022-08-29 09:56 浏览:[]次

世界杯买球一直认为记者手札是很私人化的东西,它公开发表的重要目的就是告诉总编我们小记者写完这篇报道不容易,给我涨稿费吧这样。另外就是抒发记者的情感,正如警察们也需要配备心理医生。

最近国内的数据新闻界好像流行分享数据新闻误区什么的,有越来越多的人对数据新闻的生产过程感兴趣。另外,这也是我比较看重的一个数据报道选题,正好纪念一下。(本文的写作缘由解释完毕)

当你还原一个生产过程的时候,你会消解一种权威。而一个不变的权威。so boring!解构的过程令人愉快。新闻不是真理,定稿不是永恒,数据不代表真相。

世界杯买球预判是项技术活

回到这篇数据新闻本身。我们图政数据(@一图观政)收集70个大中城市纪委书记的简历是在2015年1月。原因很简单,某城市纪委书记卷入了某个热点事件当中,我们预估事件会进一步发酵,于是开始提前准备所有城市纪委书记的选题。

数据新闻往往需要一个对普通新闻来说极为漫长的操作流程。图政对于数据准确性有着很高的要求,而这会拉长审核校对以及新闻制作的时间。当你用3分钟读完一篇数据新闻图文的时候,可能我们已经为此准备了大半个月。

世界杯买球要解决数据精度和新闻速度之间的矛盾,唯有提前预判和准备。

好吧,热点是很难预判的。3个月过去了,事件仍然没有进一步进展。各城市纪委书记依然低调神秘,没有被推到闪光灯下——虽然中纪委和省级纪委已经反复出现在赞美声中。于是我想,也许我们正面对着一个“热点话题中的盲区”。

建库的前提是抓住了问题核心

世界杯买球对于图政来说,原创选题都有个极为关键的步骤叫做建库(创建数据库),这是一些核心数据的源头。

刚做数据新闻的人习惯于一上来就建库。图政的实习生们将70个大中城市纪委书记的简历放到excel表里,列出了年龄、所在城市、籍贯等等基本【指标】。

So what?

其实不用统计籍贯我们就能知道中国官场的很多官员都是出自山东这个“学而优则仕”的官场之乡。官员的年龄有着严格的级别划分,什么年龄在什么级别里都是很清楚的。那么统计这些基本信息还有啥用?

新闻点在哪里?如何从一些人人都能从网上搜到的简历中,统计出新闻点?

Step1 阅读材料

实际上,和所有的新闻一样,【阅读材料应该是数据新闻的第一步】。熟悉这个选题及其背后的逻辑,非常重要。你需要挑出这个选题中,最特别的地方。

首先需要回答一系列问题:纪委系统的整体方向出现何种变化?中纪委、省纪委和市纪委的作用有何不同?中央意志和地市行动之间的差别是什么?各级纪委书记的用人权是如何演变的?……

在这里我要吐槽一下。中国的时政新闻不好做,因为它带有典型的师徒制、不外传等等特点。换言之,中国的时政常识没有现成的学习材料,一切都是圈子化的,圈内人都认为是公开的秘密而圈外人对此一无所知。你去翻中国政治课本学习中国政治?Oh no.你去看中国纸牌屋电视剧学习中国政治?Oh no.你还不如刷微博学习中国政治呢。

Step2 提出问题框架与回答方案

所以在你翻遍墙内外信息,对整个背景有了大方向的了解之后我国数据新闻,【第二步即是列出问题提纲和数据框架】。换言之,你要抛开数据去列出主要问题,又要查清楚有哪些数据能够回答你的这些问题。数据回答不了的,必须靠采访、评论、案例等等非数据信息来补充文章结构。

我列出的提纲如下:70个大中城市纪委书记的整体情况+专业性+本地化程度(回避制度)+有特色的纪委书记案例

记者手札:一世界杯买球篇时政数据报道的真实生产过程

在我看来,纪委书记若要实现监督职能并且跟公检法司衔接,专业化就是非常重要的。这方面内容会着重去考察。本地化程度是回避制度的一部分,在城市这一级,本来就是本地官比较多,如何实现纪委书记的“超然市外”?是个问题。

还有很重要的一点是,专业性和本地化程度都是可以通过数据看出来的,所以数据方面应该不会有太大问题。但数据很容易读起来枯燥,所以最后可以加上案例的部分,活跃一下文本。

Step3 撰写编码手册

好吧,有了背景、框架,进行到第三步就是【通过预编码来确定编码手册】。编码之前,要把所有人的所有简历看一遍、粗略记住,然后靠印象和感觉去总结里面的大致规律,再去设计具体指标进行证实或证伪。

第一,编码手册里需要明确我国数据新闻,你准备编码哪些指标?一般来说指标分为三类,第一类是基本信息(姓名、性别、出生年、所在省、所在市、籍贯省、籍贯市、初始学历、最高学历、担任现职的年份、简历……),这类信息是可以直接从简历中复制粘贴出来的。第二类是可通过一定处理得到的指标(任职地区、2015年年龄、上任时的年龄、曾在哪些系统工作过、最长工作系统是哪一个、在最长工作系统工作过多少年、有多少年纪委工作经历……)第三类是针对具体问题随时增改而设的指标(所在省和籍贯省是否相同)。

第二,编码手册里面需要很清晰地界定统计范围、方法,以及每一个【指标】的内涵和外延。这真是一项复杂的工程,它让一切简单的概念变得复杂。

比如说为什么要用70个大中城市纪委书记来作为样本?全国有400多名各城市纪委书记,为什么不全拿来做样本呢?那这70个城市怎么选的呢?

回答这个问题,我们必须计算一下数据新闻的工作量。若统计400个样本(行数),设计20个指标(列数),那这个excel总共就会产生400乘以20等于8000个数据单元格。

非常重要的一点是,图政本着对数据负责的原则,每一个原创数据格都会由校对人员一个一个进行再次校对确认!这其实就相当于编码了两次!那么校对后的数据单元格的实际工作量就变成了8000*2=16000。这个数据量对于手工作业来说是十分巨大的。

如果把16000个数据分给5个人同时去做,那你得确保这5个人对编码手册里面的编码标准有非常一致的理解,这就涉及到对5个编码员的编码培训成本。如果分给3个人去做,培训成本会降低,但编码时间又会拉长。

是的,最大的成本不是精力、不是人力,而是时间!一条新闻,必须赢得时间。如何让原创型手工编码的数据新闻的数据够精确、够全面又够快速?这是终极问题。

我们的选择是,统计70个大中城市样本,乘以20个指标,校对后数据量为2800个,尚且可以hold住。

而这70个城市又怎么选?北京天津上海重庆这四个省级城市算不算?最后我们选定了国家统计局发布的“70个大中城市房价数据”里面提到的城市名单作为统计范围。

而这在事后受到了南风窗编辑的质疑:4个城市的省级纪委书记加入到了统计整体当中,这是否科学?

我们也一直在思考这个问题,但最后还是选择加进去,因为它们虽然是省级,但实际上跟城市治理还是息息相关的并且随随便便就关切到全国几千万的人口,总不能排除在统计之外。另外,我们也不希望标题变成“70个中小城市纪委书记”之类……

虽然全国有400个城市的纪委书记,但不代表我们能找到400份简历。有很多城市纪委书记的简历简直就是高级国家机密,网上查不到的。

至此——70个大中城市纪委书记的名单出炉……是不是你们看得也很辛苦。

确定了统计范围以后,我们还要确定诸如“中国的中东西部省份是如何划分的”这种问题。这次编码我们加入了“东部沿海(北方)”和“东部沿海(南方)”这种概念,将中国分为5大区域,让每个区域的省份在5-8个之间。没有沿用“东部沿海”的整体概念,是因为这会一下子囊括13个省级区域,会弱化区域特点。

又比如“曾在哪些系统工作过”的指标,“哪些系统”又是指什么?党务系统具体包括哪些?……(以下省略三万字)

第三,编码手册的内容实际上会有增添,因为谁也不知道编码时会遇到什么情况。具体请看下文。

记者手札:一世界杯买球篇时政数据报道的真实生产过程

Step4 编码

你以为准备编码手册已经够麻烦了吗?No,只有编码才会让你的人生更灰暗。写完编码手册,你会以为你已经准备好应付各种情况,但你会发现……

在1950-1985这段时间,你无法定义什么叫“学历”。

你去查某官员曾经就读的学校,发现竟然连学校都撤并了,根本查不到当时拿到了啥学历。有的官员简历含糊其辞,甚至直接不写毕业院校。图政年轻的实习生们偏偏个个都出自重点大学,她们对函授、自考、在职、专科等等分类缺乏概念。简历中写着“大学学历”,年轻实习生会直接将其编码为“本科”,但实际上也可能是大专学历。而且若是本科毕业,简历里一般都会强调一下的……

经历了千辛万苦,最后仍然发现统计出来的结果是乱的。因为那段历史、这个社会就是模糊的。

编码中遇到的实际问题,会随时让编码手册产生解释上的增补或者调整。而这些需要随时跟所有编码员沟通,统一标准。

Step5 数据校对

以上的编码过程,其实跟学术中做研究的过程是相似的。只是速度要求更快,指标也要求要具有新闻点。真正图政强调且一直坚持的环节就是校对,包括数据校对、统计校对和图表校对三种。

数据校对就是对每个数据单元格的校对,这是一切统计、分析、撰文的基础。这个过程如此枯燥漫长无趣但又极其重要。

校对最大的问题是什么?是人才!真正的数据校对人才是凤毛麟角,不可多得,唯有处女座能担此重任。而且据图政的人才选拔培养经验,这种校对的天赋就是天生的。第一次校对就出错的人,校对到第二百次仍然会犯一堆错误,甚至可能把对的数据给校错;具有校对天赋的人,从第一次到第二百次都会非常细心。性格使然。

实际上,图政的数据新闻产量并不高,校对是个瓶颈环节。我们从国内外上百份简历中选拔出十几名适合数据新闻工作的实习生,却仅有3人适合做校对。图政所有的校对工作都会压在符合资质的有限几个人身上,工作量和精神压力可想而知。

不能说有了优秀的校对人员就能保证100%精确永远不出错的数据,只能说我们一直在努力、细心再细心、检查再检查,尽可能将错误降到人为可控的最低。

统计是美好的

建库完毕以后,统计环节就是一个令人开心的、收割果实的过程。70个大中城市纪委书记的情况几乎是一目了然,不同地区的纪委书记有啥不同特点,女性纪委书记有啥特殊之处……基本上能帮我们迅速摸清全国的情况。将数据与一些资料进行对比,就会得到很多新信息。

比如2014年5月,成都市纪委提出“纪委书记、副书记同一单位同一职位连续工作满5年应当交流任职,同一职位工作满10年必须交流”。但若严格按照成都市的要求,全国目前有多达20个大中城市的纪委书记正在逼近“应当交流任职”的年限(连续在任4年),还有15个城市的纪委书记已达到或者超过了5年,其中4名纪委书记甚至连续在任9年,逼近“必须交流”的年限。

这种“新闻点”就出来了。

一个数据库有很多种“玩法”,拥有一个数据库不代表你能挖掘出它里面蕴含的所有规律和信息。你必须亲自一个一个编码、试过很多种排列组合或者统计方法,才能找到那么几个有意思的新闻点。

比如我之前说过的,官员的年龄实际上应该是有高度的规律的,不同级别就有不同年龄。但各城市纪委书记的结果统计出来却让我们大吃一惊,年龄跨度居然如此之大!将年龄和地区分类一对比,发现北方总体上更倾向于年龄大的人做纪委书记,而中部地区则非常“锐意进取”。不同地区的风格马上跃然数据中。

统计的意义就在于它能反映一个整体的情况,可以让我们稍微减轻被经验、个案和情感影响的程度。

统计出来的纪委专业性方面的数据也让我们比较意外。因为原本以为至少纪委系统是愿意自我拔擢的,起码在纪委系统内部进行人才流动。但是各城市纪委书记们的纪委经历比我们想象中还要少。

记者手札:一世界杯买球篇时政数据报道的真实生产过程

于是延伸出很多疑问:是否有长期工作于纪委系统的中层?这些人的上升通道会在哪里呢?之前当纪委书记的那些人,是继续在纪委系统内升迁还是同样流动出去了呢?离开纪委又去了什么单位呢?

要回答这些问题,又牵涉到一个更庞大的数据库。数据与数据之间相互关联,而问题与问题之间相互牵扯。

实际上,统计解决了我们之前的一部分疑惑,但又引申出了更多的疑问。统计结果很多时候在显示“是什么”的时候有用,没有办法完全解决“为什么”和“怎么办”的问题。统计和数据就像一把刀,它本身不具备“什么时候要用刀”的哲学思考。

这个时候,我们需要采访。

采访是残酷的

我选择了东部沿海省份的省纪委和市纪委来采访。过去做电话采访比较多,这次特意选择了陌生拜访的形式,即直接打电话去问然后登门拜访。

于是问题来了。省纪委网站居然没有提供办公电话?该省省会城市的市纪委网站居然做得比省纪委还好。

这种圈子化的信息传递方式,它的信息不是平等地开放权限的,你在它的圈子里,就会发现它的号码本来就并非机密。但如果你不在它的圈子里,它就不会提供给你任何入口。

当我以一个陌生记者的身份站在省府大院门口的时候,我仰望那高而庄严的门以及门前严肃站岗的警卫。我甚至都不敢多看几次,因为一旦发现我长时间注视,那个鹰隼一样的警卫就会毫不避讳地把视线射过来警惕地瞪我。

这个大院集中了很多办公部门,包括行使“监督权”的纪委。如许多省府大院一样,这里的围墙绵延很长,你很难看到围墙之内的情形,虽然那里面是你的政府以及正为你的幸福生活而辛勤工作的公职人员。

我没有选择大门。后门有一个小小的入口,仅能供一辆车通过,即便是这样,门口还是站着一个警卫。我就这样走了进去,也许是因为我穿得衣冠楚楚并且目不斜视,所以警卫没有拦下我也没有盘问我。大院里面很干净,很宁静,绿树成荫一片祥和。走进大院以后我回头看了一下,警卫拦下了我后面的几个人。

我会想。如果我是农民工或者其他弱势群体,该怎么办。何处伸冤。墙院深深,内外两重。

当我直接走入省纪委宣传部,相关人员是惊讶的。我来之前联系过他,但之后并没有明确的回复。新闻不等人,我只能登门拜访。

有人说找政府办事是“门难进、脸难看、事难办”。我觉得这种说法是不正确的。因为我以各种身份接触过的公务员其实待人处事都非常周到亲切我国数据新闻,起码态度非常好。公务员跟普通人有什么不同吗?其实没有。他们甚至很多时候比普通人更懂得与人为善的道理。

所以最后,他们态度诚恳而亲切地拒绝了我的采访。中纪委已经出台了纪委书记提名办法和一些原则性指导意见,我想了解省纪委的进展。后来该省纪委的回复是,“还不到时候”,正在征求意见当中。我笑问,既然在征求意见,为什么不征求我们新闻媒体的意见?对方听后笑而不答。

后来我联系了另外一个发达省份的省纪委人员,她的回复把我“吓住了”。我将带着单位公章的采访提纲传真过去,她说需要等待部门领导出差回来以后再看怎么处理,领导说不定还要请示上面的领导,一层一层打报告。我跟她预估了一下时间。要走这么一个流程,没有十天半个月是批不下来的。

这就是“陌生拜访”所需耗费的精力和时间。

我强烈建议时政类记者应该以两个月写一篇稿为宜(基本工资照发),为季刊或者年刊进行创作为佳。

相比之下,专家的回答就快很多。资深专家对人事调动了如指掌,对制度建议信手拈来。采访完专家以后,我对数据的某些观点几乎颠覆了。采访之前实际上我已经根据数据写好了基本框架和分析结论,只是针对某些问题还不清晰我国数据新闻,需要专家帮忙解读。

但确实如先前所言,数据仅是事实和真相的很小很小一部分,需要一种更宏观的框架去支撑这种数据解读和切入。

记者手札:一世界杯买球篇时政数据报道的真实生产过程

比如从数据来看,女性纪委书记11位里面有9位都是2011年换届及以后调任的。这很容易让人得出结论说“新近更重视提拔女性纪委书记”。但正如庄德水老师所说,我们没有跟2011年以前的情况进行对比。2011年正是换届年,新换上来一批女纪委书记很正常。于是我在正文中,将本已准备好的女性纪委书记部分删掉了。

包括对中部地区年轻化用人的理解,同样需要更多的数据去将纪委书记的任命置于全国各地党委班子的整体任命趋势中去考虑。我们又专门查了几个城市所有的党委常委名单,但并没有发现纪委书记的任命有何特点和规律,这可能有赖于更多的样本和以后更深入的挖掘。

但是采访真正的作用并不是在于帮助我们去理解有限的几个数据问题。而在于为我们对于这一问题的整体研判提供许多新的视角。而这种视角的作用并不是增补几个数据和修改几个结论,每个视角都会修正你对这个问题的整体看法甚至观念。

观念一变,全盘皆变,并非修修补补就能贯彻这种观念。比如有的老师认为,纪委书记的专业性非常重要,有的老师又认为应该重视其综合素质而不是专业能力。到底重不重要?若重要,就该大篇幅讨论纪委书记专业性的问题,若不重要,就该牵涉出“如何吸引综合型干部加入纪委书记队伍并畅通这种进入、升迁、退出的渠道”。谋篇布局反映了你对这个问题的全盘理解。

写稿是综合处理

发稿是各方博弈

写稿的过程,就是将复杂信息条理化、可视化的过程。

数据新闻比普通新闻还多了建库的环节,本身就需要处理相当多的、细碎的数据线索。采访完成之后,我会希望能让时间倒流。能有更多时间回过头去补充一些指标,比如“是否当过城市一把手”,比如把“曾在哪些系统工作过”更加细化到“曾在宣传系统工作过”和“曾在组织部门工作过”而不是统统归入“党务系统”。这些更细化的指标能帮助我们得出更有针对性、更精确的结论。

另外,数据新闻还有可视化的过程,它的正文内容除了文字以外还有图表。如何通过版面语言实现图表和文字的综合表达,在写作的时候亦需考虑到。例如这篇文章总共占3个版面,那么在提供图表的时候就要考虑到这些图表将占多少版面,因为这会影响你文字部分的字数;同时还必须考虑到图表的放置地点……

各城市纪委书记的题目本来是单独成篇,但经编辑策划,这篇文章也被加入了封面系列报道当中我国数据新闻,所以也必须符合整体策划的思路。

文章中涉及专家采访的部分,也需要询问专家是否引用部分符合他的原意,以免出现理解偏差、以偏概全等情况。

时政新闻的审核机制就不说了。

经过了一遍又一遍地审核,一点又一点地修改,文章和图表最终印在纸上。这时候我还在检查错误,而且心惊地发现图和表居然有个数据对不上!文中写的是“有多达28位纪委书记的最长工作系统是党务系统”,而表中的相关数据却是“23人,平均工作年限21.7年”。为什么少了5人?

因为是机器自动计算,所以应该不是数值计算错误。经检查发现,因为有5人在最长工作系统的平均工作年限数据缺失,所以机器计算时自动剔除了这5个样本,28人变成了23人。

好险。缺失值的处理也要注意。不过这不算什么,之前还出现过“由于数据格中多了空格符号,导致自动计算不准确”的情况出现,当时也是幸好及时发现。

选择敏感的政治话题去做极易出错的数据新闻,有时候想想也是no zuo no die啊。

……以上省略3万字。图文最终出炉。

传播与推广

写完稿就万事大吉了吗?No,推广才是重头戏。做得好不好,必须受众说了算。

结束完平面媒体的供稿过程,接下来还得为新媒体制作专门的稿件。一是因为新媒体的尺度更大,文章内容会有变化;二是篇幅可以放置得更长,不会受版面所限。三是新媒体对综合表达、排版、语言风格、长句变短句、段落不要太长等等方面都有诸多不同的要求。所以照搬平面媒体内容是不行的。

记者手札:一世界杯买球篇时政数据报道的真实生产过程

另外,由于数据新闻前期投入非常大,可挖掘的新闻点也很多,所以我们也非常希望能全面呈现选题成果,后期赢得好的传播效果。

所以最后我们决定以专题形式组合推出多篇稿件。

推广人员需要提前联系多家合作媒体、自媒体,同时进行网络首发。什么媒体会对“如何任命纪委书记”感兴趣?这就靠推广人员去把握了……

因为写这篇手记的时候还没有进入推广环节,所以这部分内容请大家自行脑补。

最重要的部分

如果你耐心看完了以上7000多字,是真的需要好好犒劳一下的。

我诚实地在文章最后跟你分享我对这次选题的两个遗憾。第一个遗憾就是没有找到纪委内部的人直接接受采访。他们是最重要的利益相关方,却一次一次将话语权拱手相让。公对公的陌生拜访让他们有所顾虑,甚为遗憾。

第二个遗憾就是文章本身仍旧过多地保留了数据色彩——当然,这也是文章本身的特色。数据、采访内容、背景信息应该如何更加“无缝”地结合,是个问题。

正如某编辑所说,每个记者写完文章以后总会觉得留有遗憾。但新闻就是这样,它不断发展、不断流动、不断记录,我们只能在某个时间点、在有限的时间内、尽我们所能拿出这一刻我们最好的结果。

新闻报道不代表终极真理,数据不能说明所有真相。但我们仍然在路上。

语文老师说,好的文章最后要有一句点睛之笔,那我也来一句吧:这次的选题经历让我领悟到,真正好的数据新闻并非仅仅源于你对数据的敏感,更取决于你对真相的执着。

真相在这里

如果你笃信数据,

如果你想为新闻贡献你的智慧,

如果你希望跟我们一起挖掘真相,

请投简历加入图政数据新闻团队——

hr_tuzheng@163.com

我们热情欢迎记者、专家、程序猿、信息图设计师、高校实习生等等人才加入我们!

好吧其实这篇文章是一张招!聘!帖!

如果你不能加入图政但欣赏和支持我们,请继续关注@一图观政微信和微博,最好能点击下面二维码打赏我们~鼓励我们拿出更多的好作品。

各位,暂时的分别是为了带着更好的作品与你们重逢。拜。

世界杯买球作者 / 戴玉制图/唐子岳

扫码关注世界杯买球

服务热线

400-671-6258

邮箱:62748190@qq.com
地址:江苏省江苏省宿迁市