本文来自蓝衫科技和阿里云团队的对话:
1 阿里对外提供产品的方式有哪些?
- 包含了7B的开源模型,如通用模型Qwen-7B、对话模型Qwen-7B-Chat等,开发者可以在这个基础上进行二次开发,实现个性化功能
- 没有微调,不具备向量库功能
通义大模型
- 具有向量库,可以接入企业文档,实现知识问答的功能
- 支持SFT,基于微调训练可以生成更加精美的模型,实现更加准确的标准问答。为二次开发提供了更加灵活的方式
2 阿里云平台背后的逻辑是什么?
- 阿里模型平台作为开发平台,大模型能根据输入信息,提供对应的文档,API能够直接定位原文内容
- 用户通过手动上传或API批量上传的方式向向量数据库发送文档,不支持Excel形式的上传
- 对于大型文档,如10兆的文档,单并发训练耗时约20秒,而其默认的并发数是三个,一旦上传成功,文档就可以立刻生效
- 用户不仅可以使用大模型作为参考依据,快速进行微调,还可以依赖大模型进行深度的参数训练
3 如何提高客户数据安全性?
- 从内容特征、特征萃取、语义特征、统计特征几大角度出发,对结构化数据、非结构数据、图片文件以及敏感数据进行分类分级,为客户提供更加灵活、安全的网络环境
ii. 独立的向量引擎
- 采用先进的分布式架构,能够高效处理大规模的数据运算,同时保持高性能、稳定性和可靠性
iii.以敏感数据为中心的能力联动
- 应对高危风险进行操作检测,追溯泄露主体,识别异常行为,针对泄露进行告警、止血,及时发现异常数据接口暴露
iv.基于云原生架构的层次化防勒索预案
- 已知勒索病毒入侵检测,使用诱饵捕获和行为分析,拦截新型未知病毒,云端定期备份以实时文件恢复
v.各类Web业务全场景防护
- 利用AI技术智能判断数据爬取异常,精准识别虚假数据作弊以降低异常账号数据泄露风险,并避免数据接口被滥刷
4 阿里云的商业模式是什么?
- 注重数据质量控制。行业知识专家共同进行大规模的数据抽检、数据预处理和数据清洗工作。专业人员进行审查和评测,以判断数据的质量
- 为行业服务商提供通用的基础能力和技术性训练。从而提供一体化解决方案,满足不同用户的需要
- 与服务商联合,以提供一体化解决方案。为特定行业或特定类型的客户定制,从而满足不同用户的需求。比如,阿里云可以帮助零售业进行大规模数据分析,以最大程度地提升销售效率;又比如,阿里云可以帮助金融机构进行风险控制和反欺诈,以最大程度地保障数据安全
作者:刘程杰