同伴们都在外面肆意的happy。
而苏珊则一个人安静的留在房间里。
房间的智能音箱里正在播放着百老汇的歌剧。
苏珊喜欢在写代码和做数据分析的时候,多听听歌剧。
因为歌剧美妙的声音能够让她的心安静下来,并且把思维最大限度的集中在逻辑想象之中。
进行大数据分析,通常要用到R语言或者Matlab。
然后还要用一些固定的算法。
以前苏珊在大学的时候更喜欢Matlab,不过后来她自学了R语言之后,就转移到了开源平台。
首先她要提取最有价值的来自宇峰智能公司的那些医疗数据。
这些数据经过导入,清洗,转换,分析之后,会成为一个不错的商品!
医疗数据一直都是数据商业黑市上最抢手的产品。
苏珊熟练的在控制台利用命令交换处理着数据。
庞大的数据样本很快就在她的一双巧手之下变得格外的听话。
在经过略显冗长的数据导入时间之后,苏珊开始进行数据摘要工作,然后就是对数据进行清洗,过滤掉一些缺损值,异常值和重复值。
接着就是清洗数据,使得数据变成更加有规律的格式。
再然后就是数据转换。
这些都是标准操作,说起来苏珊更喜欢用一个脚本来完成这一切。
然而受限于她电脑算力的影响,这个过程略显漫长。
幸好苏珊只是小试牛刀,她只提取了一部分数据,用来尝试进行整理。如果效果良好的话,她就会用现在写好的脚本,继续处理后面的数据。
随着一杯红茶煮好之后,苏珊回到了电脑前。
命令行下的提示命令显示出她已经完成了数据的基本处理过程。
然后她就滑动鼠标开始查看,在这一过程中输出的一些内容。
苏珊缓慢的滑动着滚轮,然而就在她把滚轮转向下方的时候,突然之间她觉得屏幕上的内容有些不同步。
苏珊疑惑的拿起鼠标。
然后又试了一下。
突然一种毛骨悚然的感觉,油然而生。
她眼睛紧盯着摄像头,然而自己的屏幕居然开始不受控制的回滚了起来。
苏珊见状,吓了一跳。
很快,屏幕上突然弹出了一个对话框。
“你就是这么处理数据的?”
对话框下闪着光标,苏珊惊魂未定。但此时好奇心,战胜了恐惧。
她看了一下自己的摄像头,上面贴着胶布,对方很显然看不到自己的长相。
“你是谁?”