Sebastián Torregroza, María Paula Ordóñez, Juanita Troncoso, Juan Esteban Silva- Gemini
1. ¿Qué datos recopila la herramienta (texto, voz, imágenes)?
• Cuando usas servicios “gratuitos” (no facturados) de Gemini (por ejemplo la cuota sin coste de la Gemini API o el Google AI Studio) Google puede usar los contenidos que envías (por ejemplo: solicitudes de texto – prompts, imágenes que subes, archivos) y las respuestas que genera para mejorar sus productos y servicios de IA.  • En un entorno de pago (“Paid Services”) los datos que envías (prompts, archivos, imágenes) no se usan para mejorar los productos de Google (al menos según esos términos) sino que se tratarán según el “Data Processing Addendum” (acuerdo de procesamiento de datos) de Google.  • En la plataforma “Gemini para Google Cloud” se indica que tus “prompts” (preguntas, entradas) y “respuestas” no se usan para entrenar los modelos de Gemini — aunque algunos otros datos sí pueden usarse para mejoras de producto. 
Entonces: la herramienta puede recopilar texto, y en los casos que soporta subida de archivos (imágenes, vídeos, documentos) también esas formas de datos. Es importante asumir que sí pueden recopilarse múltiples tipos de datos de entrada.
2. ¿Cómo se usan esos datos para entrenar los modelos?
• En los servicios gratuitos/no facturados, los datos de entrada (prompts, archivos) y las respuestas generadas pueden ser utilizadas por Google para mejorar sus productos y servicios de IA, lo que implica que podrían entrar en ciclos de entrenamiento, ajuste o mejora de modelos.  • En los servicios de pago, los términos especifican que Google no usará tus prompts o respuestas para mejorar sus productos.  • En la documentación de “Gemini para Google Cloud” indican que los “prompts” y “respuestas” no se utilizan para entrenar los modelos de Gemini en ese entorno. 
Entonces: depende del tipo de servicio (gratuito vs de pago). En el gratuito existe uso de datos para mejora/modelo; en el pago no para entrenamiento de producto, pero sí se guardan datos operativos para control de uso, seguridad, etc.
3. ¿Qué derechos tiene la empresa sobre los contenidos generados?
• En los términos de la API, se menciona que cuando envías contenido, otorgas a Google una licencia para usarlo conforme al apartado “Submission of Content”. En el servicio gratuito, esa licencia se extiende al contenido que envías y las respuestas generadas.  • En los casos de “tuning” (ajuste personalizado) de modelos, el contenido que importas o subes para ese fin será retenido en conexión con los modelos ajustados, y cuando eliminas el modelo ajustado, el contenido relacionado también se elimina. 
Entonces: Google tiene el derecho (bajo licencia) de usar el contenido que subes o que generas para ciertos fines (mejora de servicio/IA) en los servicios gratuitos. En entornos de pago, sus derechos sobre el contenido generado y enviado se limitan según el contrato de procesamiento de datos.
4. ¿Existen limitaciones en los tipos de uso (educativo, comercial, político)?
• En la página de “Políticas de uso” (“Usage Policies”) de la Gemini API, se listan restricciones de tipo: por ejemplo, no usar la API para desarrollar modelos que compitan con los servicios de Google; tampoco intentar extraer o replicar componentes del modelo.  • También en la política de “Additional usage policies” se indica que los usos están sujetos a la “Política de Uso Prohibido de IA Generativa” y a los términos adicionales, lo que implica que ciertos usos (por ejemplo usos ilegales, discriminatorios, de manipulación política, etc) están prohibidos. 
Entonces: Sí, hay limitaciones en el tipo de uso. Aunque no siempre se divide explícitamente entre “educativo, comercial, político”, los términos prohíben usos que violen leyes, derechos de terceros, o que compitan con Google. Si es uso comercial o político, conviene revisar el contrato específico.
5. ¿Qué nivel de transparencia tiene el servicio sobre sus algoritmos y fuentes de datos?
• Google declara que la herramienta utiliza prácticas de gobernanza de datos robustas, cifrado, etc, en su documentación de “How Gemini for Google Cloud uses your data”.  • Pero respecto a los algoritmos y las fuentes de datos de entrenamiento, no se divulgan públicamente de forma detallada (por ejemplo, qué exactas bases de datos fueron usadas para entrenamiento, o todos los parámetros del modelo). En los términos de la API se menciona que no puedes “reverse-engineer, extract or replicate any component of the Services (e.g., parameter weights)”.  • En la política de uso adicional se indican los mecanismos de monitoreo, retención de datos por 55 días para los prompts, etc. 
Entonces: Hay transparencia en cuanto al tratamiento de datos (qué se guarda, por cuánto tiempo, cifrado), pero menos transparencia en cuanto a los detalles internos del modelo (fuentes específicas de entrenamiento, arquitectura exacta) ya que esos están protegidos por los términos.
Fuentes: 1. Google. (2024). Gemini API Terms of Service (Preview). Google AI Developer. Recuperado de https://ai.google.dev/gemini-api/terms_preview
2. Google. (2024). Gemini API Terms of Service. Google AI Developer.
Recuperado de https://ai.google.dev/gemini-api/terms
3. Google. (2024). Gemini API Usage Policies. Google AI Developer.
Recuperado de https://ai.google.dev/gemini-api/docs/usage-policies
4. Google Cloud. (2024). How Gemini for Google Cloud uses your data. Google Cloud Documentation.
Recuperado de https://cloud.google.com/gemini/docs/discover/data-governance
5. Google. (2024). Privacy Policy. Google Policies & Principles.
Recuperado de https://policies.google.com/privacy
6. Google. (2024). Terms of Service. Google Policies & Principles.
Recuperado de https://policies.google.com/terms
