悟道是中国第一个超大规模智能模型系统。它是一个语言模型,旨在在人类层面的思维上超越OpenAI的GPT-3和谷歌的LaMDA。经过4.9TB的图像和文本训练,悟道在9个基准上超过最先进的水平,比任何同行更接近实现通用人工智能和人类水平的思维。
悟道接受了4.9TB高质量的英文和中文图像与文本训练:1.2TB中文文本数据;2.5TB中文图像数据;1.2TB英文文本数据。悟道基于开源的MoE系统FastMoE进行训练。MoE是一种机器学习技术,将预测建模任务划分为子任务,针对每个子任务训练专家模型,并开发门控模型。该门控模型基于输入学习咨询何种专家,并组合预测。
FastMoE使悟道可以并行咨询不同专家,选择预测结果最佳的模型。例如,输入为英文文本,悟道将使用英文文本生成响应的预测模型。相比同类产品,悟道受训数据量较大,涵盖中文与英文两大语言,更加贴近人类思维与语言表达的复杂性,生成的回应也更加逼真自然。这使其适用于机器翻译、客服问答、文本生成等人工智能应用场景,表现优于现有模型。悟道基于MoE系统并行咨询多个预测专家模型,选取效果最佳的组合预测,生成的回应更加准确。这种并行预测机制可以有效避免单一模型的局限性,提高预测效果,是一种先进的多模型融合机制。这使悟道在不同任务上的表现不受单一算法影响,更加稳定与优异。总之,悟道是中国首个超大规模多语言智能模型系统。它通过海量数据训练,基于先进的MoE并行预测机制,生成回应效果超越当前同行,更接近人类思维复杂性。悟道适用于机器翻译、客服问答等人工智能应用,属于一款功能强大、预测精度高的新一代语言模型,代表了人工智能技术发展的最新进展。