技术天地

0

聊聊司法大数据行业

头像
小财

大数据、AI的一阵风刮起,很多行业都想借此东风发展一下,靠司法行业吃饭公司也不例外。毕竟孟建柱都讲话了,公检法司的需求硬性的摆在那,所以司法大数据、AI应用必将是各类数据公司要争夺的市场。

个人对这个行业也关注很久了,本早想写点自己对这个行业发展和从业人员发展的看法,但各种原因拖了一年多,现在把一些想法写出来,希望对同样关注、准备投入这个领域的其他人,无论是经营公司也好,找个糊口的工作也好,有点帮助。

言归正传,行业已经确定,之后首先要考虑作为经营主体——公司的生存能力,以下逐层分析。


首先,得有数据

也就是说要有法律法规,要有裁判文书,没有这些,所谓的大数据也就是无本之木、无源之水。所以,作为一个司法大数据的公司,它在前期会有很大的资金投入在这一块。

如果对数据的要求不高,数据采集这块还是比较容易达标的。法规好说,主要是裁判文书。但也比以前要容易多了,毕竟有了慷慨无私的裁判文书网,只要采取点技术手段就可以取得大量的官方权威的裁判文书。

如果对数据要求比较高,要比官方网站上更全更及时,那得一家一家法院、一家一家律所的去谈合作了。但这样做的成本太高的,全国那么多法院,要真想弄全了,得养多少地推,想想滴滴当年的推广。对于多是创业阶段的司法大数据公司,这个成本考虑不现实。进而,有追求但限于资金的公司,很可能会的采用优势兵力解决重点领域的办法,搞定北上广的,或搞定某一特别领域。

但是,数据只是基础,如果只限于此,最多做成个法律界的数据库公司。但法律界的数据库公司早已高手云集,外有westlaw、lexis&nexis,内有北大法宝,就裁判文书这点数据,如果这些老牌数据库公司愿意,可以随时上马。好容易因为船小走得快而占有的市场份额,随时可能转易他手。

所以,司法大数据公司得加码,加什么合适,分析!


其次,得有分析能力

分析数据本就是“大数据”应有之意,分析胜率,分析要素权重,分析法律关系,分析法规联系,等等等等,不一而足。这时候,公司成本不管愿意不愿意,成本都会上去了。

数据收集方面,如果凑合着过,可能外包一个爬虫程序,买个云服务,公司就可以上马了。但加上分析,人员素质最低要求也得是个法本吧,人员数量得看分析任务是什么了。胜率、要素权重之类的不现实。

有两个问题,一是裁判文书数量,二是对文书的理解程度。前者纯人工要耗费大量时间,后者给时间也不一定想明白,只有屁股坐到那个位置,才能明白为什么那么写。

对于这两个问题的解决难度,个人是深有体会。因为自己会点编程,做过胜率、权重之类的项目,勉强可以应付问题一;有检、法、律全套司法流程经验,算是解决了问题二,但真做起来也累够呛,各种坑。

总体感觉是,此项工作初始对编程能力的要求大于对法律分析能力的要求,而且要求很高;之后又对法律分析的能力有要求。但如果有一个高水平的码农,数据解析水平已经高到能解析文字的能力(仅指理解语义,还不谈看得懂法律文书),为什么还要这个总量小、要求高的领域内工作(相对于其他领域而言)?完全可以去技术门槛更低、市场更广、个人收益更高的领域去。

所以初创公司现实的策略是回避掉这一块,比方说,从比较固定的法律条文图谱开始,串联起所有相关的法律条文。这工程说大不大,说小也不小,不适用个人干,也不适合大公司干,挺适用小公司干。但有没有商业价值,以及知识产权保护,又是个大问题。

当然,还有另一种折衷的方式。就是客户咨询什么问题,公司就研究什么问题,不追求全知全能。不过,这不就是个法律界的咨询公司——律师事务所吗?业务领域出现严重的重叠,而人员素质和经验又无法匹敌,这是拿短板去跟别人长板PK,还是会挂的。


最后,独有的优势在哪?


①按理想的路线,是走真AI路线。但是走不通,无论是成本上的考量,还是技术上的无奈。

真AI,深度学习也好,机器学习也好,换了别的名字也一样,基本上可以说不可能。两个问题,一是算力,一是算法。算力是决定性力量,意思就是计算能力有多快;算法是计算方法,算力不够或者需要算得更快时,算法上。

先只谈算法。想要看一个行业发展未来,得看它最前沿的部分。AI的前沿是还没实现的理论技术,捡起多年不用的英语,耐着性子恶补了些统计学的基础概念,总算是看懂了些前沿论文。但是(重点来了),看下十几篇,发现什么是AI,AI应该往哪个方向发展,走在前沿的大牛们都没有一个统一的说法或者理论。

举个不恰当的例子,现在的AI前沿有点像一幅漫画——“灯下找钱包”,明明做起来有效,但没有个理论解释为什么有效。

这就很尴尬了,哪个投资者敢大胆地把钱投在一个不知道为什么赚钱的领域?有意向的投资者也最多是投一点看看风向,所以这个行业的公司不仅不可能大,而且因为技术上的不确定,公司很难通过筑造技术壁垒的方法成长,无法放心大胆地走技术路线,做不了真的AI。


②走不通真AI,就只能借着AI的噱头,走一般公司赢利的模式,边走边看。

一般公司会怎么做?比方说出出书、售售课、组建个平台、最多卖卖数据,似乎与AI有关,但实际上,没有什么关系。与一般的线上培训平台、电商,或者旧有的咨询公司模式,没有本质上的差异。但并不是说这样的公司不赚钱,只是并没有听上去的那么高大上。

综述一下,现在在司法大数据行业的经营的公司,除非有政府背景,否则,结合第①点中分析的公司不可能大的原因,公司的赢利能力与实际控制人的融资能力、营销能力密切相关,而所需要的人才大概率更倾向于高级销售和基础材料收集人员,对法学、IT系统开发(都不算AI调参了)的能力需求度都不会很大。当然,具体看公司的发展战略了。


最后简单的结论,如果你是投资者,关键是调查下经营者的背景;如果你是找工作,虽然法学功底也有用,但公司更多考量的是你的营销能力。如果你是纯法律背景的朋友,没有什么其他方面的积累和能力,还是谨慎为妙。



本文转自 知乎,原文链接:https://zhuanlan.zhihu.com/p/29922329,如需转载请自行联系原作者
头像
丢弃

你的回复

如果只是评论问题或者答案,请使用评论工具。 您可以随时 修改您的答案 - 不需要重复回复相同的问题。 另外, 请别忘了去评价 - 这可以帮助选择最优的问题和答案!