返回

穿越黑龙江1940

首页
日/夜
全屏
字体:
A+
A
A-
第267章 加速数据利用合规化(1 / 3)
上一章 返回目录 下一页

第267章加速数据利用合规化

能如此体恤下属的情绪,黄静越发觉得追随林灰是个正确的选择。

当然黄静内心深处的自我攻略,林灰对此是并不知晓的。

林灰之后和黄静也没聊线上办公。

而是又聊了一些美國科技巨头的讯息。

虽然基本都是八卦之类的无聊消息,不过也不是所有信息都是八卦。

至少林灰不是一无所获。

从跟黄静的后续谈话中林灰从黄静那得知了一个颇为重要的信息。

那就是蘋淉方面似乎致力于在谋求一笔总额大概在两亿美元到三亿美元大宗数据交易。

对于这条消息黄静在描述的时候有点含糊其辞。

似乎生怕不小心坑了林灰似的。

以前黄静描述的信息往往都言之凿凿。

很少出现不自信的情况。

涉及到这宗交易黄静先说是数据交易后来又说不是数据交易。

搞得林灰都有点糊涂。

即便是小道消息林灰也很看重相应的价值,毕竟很多时候无风不起浪。

至于黄静说得这个讯息到底是什么,经过进一步的询问以及多方查验。

以及更进一步的一番推敲,林灰还是搞明白了。

所谓的两三亿美元的数据交易指向的确实是数据,但又不是一般类型的数据交易。

蘋淉方面此次谋求的数据收购实在是一桩比较特殊的数据交易。

因为通过各方面渠道获得的信息,林灰觉得蘋淉方面的目标指向的实际是:

——“暗数据”。

图谋于此,也可以看出来蘋淉似乎在明修栈道暗渡陈仓啊。

暗数据有时候也被称为尘埃数据。

暗数据或者说“尘埃数据”是由所有冗余的、经常被遗忘的数据组成的。

这些数据是公司和组织在其活动过程中收集的,但随后又不使用。

暗数据往往是无结构、无标记、无分析的信息。

比起此前林灰忽视的标注数据。

暗数据就更没啥存在感了。

暗数据这类数据几乎是被无视的。

毕竟这类数据存在于网络和服务器中,只会占据了宝贵的空间。

一般来说,暗数据主要有三种类型:

第一种是传统的基于文本的数据。这可能包括电子邮件,日志和文档。

第二种类型是非传统数据。

这包括未标记的音频和视频文件、静止图像和声音文件。

第三种类型是深度数据。

这包括深层网络中搜索引擎无法触及的信息。

这些深度数据大多是私有的,由政府或私人机构控制。

它包括由学者、政府机构和当地社区策划的数据、医疗记录、法律记录、财务信息和组织特定数据库。

以上这些数据都可以称之为暗数据。

……

暗数据这类数据相比传统意义上数据要更隐晦一些。

暗数据这种未标注过的数据虽然不能拿来直接用吧。

但却不能否定这种东西的潜力。

反正绝对不能说这些信息不重要。

至于果子为什么对这类东西感兴趣。

因为收集这类一贯不被视为数据的数据。

实际上通过深耕是能得到跟传统数据差不多的功效的。

而且使用这类数据的话,通过一些概念性的教育消费者甚至可以形成一种企业从来不涉足一般数据的印象。

这对于树立企业形象岂不是很有妙用??

总之,对于既当又立的企业不能说是没有诱惑力。

反正林灰觉得从暗数据入手这倒是符合很多科技巨头的行事风格。

类比林灰以前估量的价格。

如果说几千万美元就能买上千万条双语标注数据。

可想而知像蘋淉所谋求的价值两三个亿美元的暗数据肯定是一笔相当庞大的数据。

涉及到标注数据跟暗数据一大区别在于标注数据是结构化进行过一定处理的数据。

而暗数据很大程度上是未被结构化处理甚至很是“乱糟糟”的数据。

结构化的数据一般是即有固定格式和有限长度的数据。

例如填的表格就是结构化的数据。

比如说“国籍,种花家,民族:汉,性别:男,姓名:张三,年龄:……”

上一章 返回目录 下一页