Lesson 23 大数据时代

什么 是 大 数据 ? 枯燥 的 名词 解释 会 让 “ 科盲 ” 们 更加 摸不着头脑 , 有 学者 以 通俗 的 例子 这样 告诉 我们 ,“ 每个 人 乘飞机 时 , 都 是 自己 选择 航线 , 这 是 人 的 智慧 , 当 人们 的 选择 结果 反映 到 具体 的 航程 中来 , 就 会 有 大量 的 数据 被 记录下来 。 我们 根据 这些 原始 的 、 堆积 如 山 的 记录 梳理 出 的 航程 设计方案 , 将 是 最 卓越 的 。 这 就是 大 数据 的 方法 。 大 数据 有 什么 用 ? 举例 来说 , 百度 在 2014 年 世界杯 期间 准确 预测 德国 夺冠 , 就是 大 数据 的 功劳 。 百度 的 做法 是 : 派遣 数据 专家 全面 搜索 5 年来 全世界 987 支 球队 3.7 万场 比赛 的 数据 , 并 与 彩票 中心 等 占有 大量 数据 的 相关 机构 建立 战略 合作伙伴 关系 , 将 各类 数据 融入 预测 模型 中 。 这一 海量 数据库 共计 涉及 19972 名 球员 和 1.12 亿条 相关 数据 。 之后 , 百度 对 2006 年 和 2010 年 世界杯 的 淘汰赛 进行 了 结果 验证 , 准确率 接近 75%, 这一 结果 令 大 数据 研究者 万分 振奋 。

那么 , 大 数据 如何 连接 未来 ? 我们 不妨 以大 数据 与 健康 为例 加以 说明 。 人们 公认 “ 医疗 ” 和 “ 健康 ” 分属 两个 完全 不同 的 领域 , 有 了 大 数据 , 它们 不仅 相通 相融 , 还有 可能 彻底 扭转 先前 陈旧 而 被动 的 有 病 治病 方式 , 改为 积极 防治 , 甚至 把 疾病 消灭 在 萌芽 状态 中 的 想法 也 不 显得 荒谬 了 。

做 进一步 讨论 之前 , 有 一个 前提 必须 交代 清楚 : 每 一次 疾病 的 发生 都 不是 偶然 的 , 追究 原因 , 无非 是 基因 、 遗传 、 环境 、 生活习惯 等 。 虽非 偶然 , 却 无法 预料 , 因此 , 传统 医疗 只能 帮 你 治病 。 如果 能 找出 病因 呢 ? 消除 隐患 就 成为 了 可能 ,“ 健康 大 数据 ” 就是 要 做 这件 事 。 比如 心脏病 , 病人 发病 常常 是 有 预兆 的 , 如果 对 患者 的 心跳 数据 有 足够 长时间 的 持续 积累 , 就 可能 预测 病人 发病 的 时机 ; 对于 心脏病 突发 致死 的 案例 , 如果 能 提前 24 小时 监测 到 零星 先兆 , 甚 可以 挽救 患者 的 生命 。

利用 大 数据 对 一个 病种 进行 细致 的 监测 , 意义 是 不言而喻 的 。 中国 血压 有 问题 的 人 不在少数 , 其中 高血压 患者 有 1 亿人 , 潜在 患者 还有 1 亿人 , 如果 这 2 亿人 都 能 通过 “ 高血压 手表 ” 或者 什么 先进 器材 进行 监测 , 对 他们 的 健康 进行 人为 管理 , 将会 是 非常 有 前景 的 尝试 。

在 未来 医疗 模式 中 , 临床 会 尽量减少 对 人 的 依赖 , 因为 医生 是 切切实实 的 稀缺 资源 , 大 数据 的 优越 之处 就 在于 , 能够 大大提高 医生 的 工作效率 , 将 医生 的 能量 发挥 到 最大 。 因为 大 数据 的 健康 维护 不是 得 了 病 之后 再 采集 数据 , 而是 平时 就 在 一些 特殊 设备 的 协助 下 , 把 人 所有 的 生理 数据 攒 起来 , 对 其 进行 分析 处理 后 , 发给 医生 , 远程 医疗 服务 将会 变得 可行 而且 优质 。 实事求是 地 讲 , 即便 仅仅 做到 这 一点 , 大 数据 为 人类 做出 的 贡献 也 远远 超出 了 我们 的 期盼 。

展望 未来 , 大 数据 将会 走进 我们 生活 的 各个 领域 , 有人 这样 定位 大 数据 时代 的 意义 :“ 拥有 知识 曾 意味着 掌握 过去 , 现在 它 更 意味着 预测 未来 。