¿Qué fuentes de datos utiliza para entrenar su gran modelo lingüístico (LLM)?

Genesys conserva los datos utilizados en el ajuste del modelo tanto de conversaciones de código abierto como de clientes de Genesys Cloud que aceptan participar en las mejoras del producto, incluidas llamadas de voz y chats de varios canales digitales. Se procura que los datos abarquen múltiples ámbitos e industrias, y se revisan rigurosamente para comprobar su integridad y exactitud mediante procesos automatizados y anotaciones manuales.

Los datos reflejan los tipos de conversaciones que se espera que el modelo encuentre en escenarios de producción reales. Existen medidas para mitigar los prejuicios relacionados con el dominio, el sexo, la raza u otras características protegidas. Genesys también aplica procesos estrictos para filtrar el lenguaje inapropiado; todos los datos se archivan de forma segura en Genesys Cloud con un acceso estrictamente controlado.