1.自研产学研一体化深度学习开发平台
实验室自主研发了深度学习开发平台,支持PyTorch、TensorFlow等主流深度学习框架,集成多样化的计算资源,实现高度灵活和可扩展的计算环境。其核心在于统一计算框架解释器和统一资源管理器,共同实现高效、可追踪的任务调度和资源分配。平台强调用户友好性,通过统一的可视化编程接口,使得无论是专业的科研人员还是初涉人工智能领域的初学者都能轻松上手。此外,平台还致力于建设完善的智能计算生态圈,形成多场景应用库,实现产、学、研、用的一体化发展。
在应用方面,平台已成功应用于多个环境保护领域,包括三维空气质量模拟分析、水污染溯源大数据分析、网络舆情环境问题识别与风险分析以及自然保护地人类活动监测分析。运用了先进的机器学习和深度学习算法,如交叉网络、TextCNN模型和自注意力生成对抗网络等,实现了对环境问题的快速识别、预测和解决。
为了更精准地满足大模型在多领域的广泛需求,实验室在此基础上进一步推出了基础大模型平台。该平台涵盖了大模型微调、任务流设计和可视化应用等关键环节,并提供一站式的解决方案。值得一提的是,我们的夫子•明察司法大模型就是在这个平台上训练而成的。它不仅降低了大模型应用的技术门槛,也极大地加速了其在各个领域中的实际应用和推广。
2.智能推荐与信息检索
在实验的传统研究方向信息检索领域,实验室积累了大量的研究成果。在SIGIR, WWW, CIKM, KDD, WSDM, ACL等顶级国际会议以及TKDE, TOIS等顶级国际期刊发表论文200余篇,并斩获CIKM2017的最佳论文Runner-up Award,CSRanking信息检索方向位列世界前10。在社会化推荐、跨域推荐、会话式推荐、序列推荐、医疗推荐等方向提出一系列创新性的推荐方法,受到国内外同行的广泛关注与引用。相关成果已经应用于海信聚好看智能电视推荐,微信,腾讯的信息流推荐等。
3.自研领域基础语言模型
实验室基于海量中文无监督司法语料(包括各类判决文书、法律法规等)与有监督司法微调数据(包括法律问答、类案检索)自研开发中文司法大模型。该模型支持法条检索、案例分析、三段论推理判决以及司法对话等特色功能,旨在为用户提供全方位、高精准的法律咨询与解答服务。