免费数据质量管理平台·查看详情
400-800-9577 400-800-9577
产品
解决方案
典型案例
赋能体系
资源中心

实测|DeepSeek vs 阿里Qwen3,大模型问数到底哪家强?

视频简介

本次AI智能问数场景测试对比了DeepSeek和Qwen3等主流大模型的表现,各模型在响应速度和准确率方面展现出不同的性能特点。

视频内容

最近,我们针对AI智能问数场景,对比了DeepSeek R1和千问3这两个最热门的大模型。
DeepSeek R1满血版的平均耗时是62秒,正确率是97%。
Qwen3 235B模型的平均耗时是29秒,正确率是94%。
但Qwen 3 32B模型的平均耗时是16秒,正确率是97%。准确率与DeepSeek一致,但性能是DeepSeek的4倍。
所以,Qwen3 32B这个小模型完胜。
Qwen3 235B这个大模型多了一个不应该的错误,它使用开票金额当成成交金额,正确的应该是使用合同金额,惜败。
Excel文件读取、处理和入库的整个过程

【图(1)】

测试环境说明:
1、测试环境:阿里云在线接口。
2、测试场景:某品牌CRM数据,包括客户、跟进记录、商机、合同、发票、收款等信息。
3、测试用例:30个(18个低难度、7个中难度、5个高难度)

数据中台

一站式数据中台解决方案,助力政企构建数据驱动的智能决策体系

了解更多

龙石数据治理赋能体系

产品

提供治理工具

了解详情

培训

提供方法培训

了解详情

陪跑

指导样板工程

了解详情

《数据治理实战指南》

提供实施工具包

了解详情
微信咨询
微信咨询
苏州龙石信息科技有限公司微信公众号
电话咨询
电话咨询
400-800-9577
预约演示
预约演示
资料下载
资料下载
预约演示
资料下载

想了解数据治理如何落地?

预约演示
免费咨询