第579章 护航(6/6)
耀宗说好。十二月二十九号,何耀宗在公司开了一个会。参会的是老谭、孙工,还有几个技术骨干。何耀宗把老周那边的事说了一遍。“两件事。第一,观澜自己要升级,加强对API接口修改的监控。第二,给老周他们做一套新的,用观澜的技术底子,但要根据他们的需求定制。”孙工先开口道:“API接口那块,技术上不复杂。百科平台大部分都开放了编辑接口,我们只要去读他们的修改日志就行。关键是有些平台的修改日志不对外公开,只对合作方开放。这个需要老周那边出面去谈。”何耀宗道:“老周会协调。你先把技术方案做出来。”孙工点头。老谭问:“给老周他们做的那套,规模多大?”何耀宗道:“他们没说具体,但肯定是千万级以上的数据量。几个部门合用一个平台,每天要处理的内容至少是观澜现在的十倍。算力方面,可以用贵州和云南的算力中心,那边还有富余。数据存储要重新设计,观澜现在的架构撑不住这个量。”老谭在本子上记了几笔。何耀宗又道:“还有一件事。老周他们那套系统,不能直接照搬观澜。观澜是我们自己用的,监控的目标是公开信息。他们那边有很多内部数据源,涉密的、不公开的,接入方式和安全级别都不一样。你要跟他们的人详细对需求,把数据安全这块放在第一位。”老谭说好。十二月三十号,老谭带着孙工去了老周那边。对方派了一个处长对接,姓吴,四十出头,搞了二十年信息化。吴处长把他们带到一间会议室,桌上摊着一摞需求文档。老谭翻了翻,比他预想的厚。“吴处,这些需求都要做?”吴处长笑了笑。“不急,分批做。先做最核心的——全网信息采集、行为聚类、溯源追踪。这三个功能现在最缺。其他的可以往后排。”孙工在旁边问了一句:“数据源方面,你们能提供哪些?”吴处长从抽屉里拿出一张清单,递过去。孙工看了一眼,上面列了几十个数据源,有公开的,有半公开的,还有几个标注了“内部”的。“这些内部数据源,接口能开放吗?”孙工问。“能。但要走安全审计流程。每一笔数据调用都要有记录,定期报备。”孙工点点头,把清单收好。老谭道:“吴处,年前我们先出个技术方案,春节后启动。如果顺利的话,年底之前能上线。”吴处长道:“行。有什么需要我们配合的,随时说。”十二月三十一号,下午。何雨柱在书房里看何耀宗发来的观澜升级方案。方案不长,几页纸,核心是两条:一是增加对API接口的监控,二是优化行为聚类算法,把误报率降下来。他把方案看完,放在桌上。窗外天已经暗了,院子里亮起了灯。远处有零星的鞭炮声,断断续续的。何耀宗发来一条微信:“爸,观澜升级方案您看了吗?”何雨柱回了一条:“看了。让他们做。别拖到年后,年前就启动。”何耀宗回了个“好”。何雨柱把手机放下,站起来走到窗前。院子里那棵树光秃秃的,路灯照在枝丫上,影子落在雪地上,细细碎碎的。小满从厨房出来,站在客厅门口。“老周那边的事谈完了?”“谈完了。年后启动。”“那过年的事呢?今年怎么安排?”何雨柱转过身。“老规矩。初一都过来。”小满点了点头,转身回厨房了。何雨柱站在窗前又看了一会儿。远处又响了一挂鞭炮,噼里啪啦的,在冷空气里炸开,声音传过来的时候已经闷了。他想起老周问的那个问题——如果对方在后台直接改数据库,观澜还能不能抓到。能。改一下抓取策略就行。但老周没问的那个问题才是关键——如果对方不修改现有的词条,而是直接删除,然后重新建一个呢?删除操作有没有日志?日志保不保留?保留多久?谁有权访问?这些不是技术问题,是平台治理的问题。技术能解决的,有限。他转过身,走回书桌前,拿起笔在观澜升级方案的最后加了一行字:“增加对词条删除和重建行为的监控。不仅要看改了什么,还要看删了什么,新建了什么。”写完之后,他把方案拍了一张照片,发给何耀宗。何耀宗秒回:“收到。加上。”