hola
Icon Newsletter

Buzzwords:
Convierte el ruido tecnológico en conocimiento accionable.

Aquí puedes leer la edición 6

🧿 ¿Dónde han quedado Alexa y Siri? ¿Amazon y Apple ya no son punteros en IA?

Amazon y Apple niegan estar atrasados en IA y dicen que millones de personas usan Alexa y Siri cada día, lo que demuestra que a la gente le gusta. Pero desde que apareció GPT, Amazon ha estado buscando maneras de mejorar la IA de Alexa, incluso hablando con startups de IA. Está intentando un golpe de efecto como el de Microsoft como OpenAI, que no es descartable, pero que no le será nada fácil.

Google también se ha sorprendido con GPT y ha lanzado su propio chatbot: Bard. Aunque GPT tiene sus fallos, muchos creen que representa un cambio en IA y que mejorará con el tiempo. Si no se ponen las pilas, Amazon, Apple y Google podrían acabar como otras empresas que fueron superadas por sus rivales en tecnología. Sus negocios pueden estar en peligro. 

Si Amazon logra integrar algo como GPT en Alexa, podría hacerla más conversacional y personalizada. La Alexa del futuro podría resumir mejor los artículos de Internet o reconocer más comandos para el hogar inteligente. Pero como comentábamos antes Alexa trabaja en un marco delimitado que es su hardware y su software. Es más realista pensar que GPT “corra” en asistentes de voz a que los asistentes de voz mejoren tanto como GPT. Pero eso no será negocio para Amazon, porque su objetivo no es vender hardware, si no que su software sea un negocio en sí mismo.

Aunque hay retos con tecnologías como GPT, Amazon sigue siendo líder en el mercado de asistentes de voz y tiene una gran base de dispositivos en los que está disponible. Los modelos de gran lenguaje como GPT parecen más humanos, pero también son más difíciles de controlar que sistemas como Alexa.

«El mercado de los asistentes de voz en Estados Unidos, Inglaterra y Alemania»

¿Qué entendemos por asistentes virtuales impulsados por la inteligencia artificial?

Alexa y Siri son asistentes virtuales creados por Amazon y Apple, respectivamente. Ambos emplean tecnologías de inteligencia artificial (IA) para ofrecer una amplia gama de funcionalidades a sus usuarios. Se basan básicamente en tres tecnologías:

  • En plan sencillo: Alexa y Siri son como amigos que entienden lo que dices, gracias a algo llamado NLP. Ellos recogen las palabras y las analizan para saber qué quieres.
  • Luego está el ASR, que es como si le hablas a alguien y esa persona escribe lo que le dices. Así, puedes hablar con Alexa y Siri en vez de escribirles.
  • El TTS es al revés: cuando los asistentes te responden, convierten el texto en voz para que lo escuches.

Nos vendieron que estos “nuevos amigos” aprenderían de ti y de otros usuarios, para que cada vez fuesen más listos y nos entendiesen mejor. Esa promesa, en gran parte, ha fracasado. 

¿De dónde vienen los asistentes de voz?

Parece que fue ayer, pero no.

Cuando Alexa salió en 2014, muchos pensaban que sería la próxima gran plataforma después de los smartphones. Sin embargo, no ha sido tan rentable como se esperaba, y sus principales usos siguen siendo básicos, como poner música o temporizadores. Siri de Apple y Echo de Google tampoco lo han hecho mucho mejor.

Dos años después del lanzamiento del primer dispositivo con Alexa, Jeff Bezos afirmó que el asistente de voz tenía la capacidad de transformarse en una «cuarta columna» en el negocio de la empresa, aportando de manera considerable a los resultados de Amazon junto con el comercio electrónico, la suscripción Prime y los servicios en la nube.

Amazon creía que Alexa le iba a generar ingresos de dos maneras:

  • Creando un ecosistema de aplicaciones como el de Apple y Google con sus stores, pero Amazon tiene sólo 130.000 skills (es como llama a sus apps) , en comparación con los más de 2 millones de aplicaciones en la App Store y lo mismo en Google Play.
  • Con publicidad. Amazon ganó mucho en publicidad, pero la mayoría viene de su sitio web, no de Alexa. A la gente le gusta poner anuncios en Amazon.com y en sus videos, pero no tanto en Alexa.

¿En qué se parecen y en que no las tecnologías de los asistentes de voz y tecnologías como GPT-4?

Los asistentes de voz y tecnologías como GPT-4 comparten algunas similitudes y diferencias. Veamos en qué se parecen y en qué no:

Similitudes:

  • Ambos utilizan NLP, o Procesamiento del Lenguaje Natural: Tanto los asistentes de voz como GPT-4 emplean tecnologías de NLP para comprender, analizar y generar texto en lenguaje humano. Aunque aquí se está demostrando que OpenAI a conseguido mejores modelos de NLP.
  • Aprendizaje automático y aprendizaje profundo: Los asistentes de voz y GPT-4 se basan en algoritmos de aprendizaje automático y aprendizaje profundo, como las redes neuronales, para mejorar su rendimiento y adaptarse a las necesidades de los usuarios.
  • Interacción con el lenguaje humano: Ambos están diseñados para interactuar con los usuarios utilizando lenguaje humano, ya sea mediante texto o voz, y proporcionar respuestas o realizar acciones según las consultas de los usuarios.

Diferencias:

  • Entrada de audio vs. entrada de texto: Los asistentes de voz, como Alexa y Siri, están diseñados para procesar entradas de audio mediante el uso de tecnologías de ASR, o Reconocimiento Automático de Voz. Es una tecnología que ayuda a los cacharros, como los asistentes virtuales, a entender lo que les dices en vez de tener que escribirles. Por otro lado, GPT-4 es un modelo de lenguaje basado en texto que trabaja principalmente con texto escrito.
  • Funcionalidades específicas vs. generación de texto: Los asistentes de voz están diseñados para realizar tareas específicas, como responder preguntas, reproducir música o controlar dispositivos inteligentes. Es lo que se denomina TTS, o Text-to-Speech (texto a voz). GPT-4, en cambio, se centra en generar texto de manera coherente y contextualmente relevante, pudiendo adaptarse a una amplia variedad de aplicaciones y tareas. Vamos a poder conectar otras tecnologías con GPT-4, con la recién anunciada “store” de aplicaciones.
  • Integración con servicios y dispositivos: Los asistentes de voz suelen estar integrados con servicios y dispositivos específicos (por ejemplo, Siri en dispositivos Apple y Alexa en dispositivos Amazon). GPT-4 es un modelo de lenguaje general que puede ser implementado en diversas aplicaciones y plataformas. En esencia es transversal, y eso está haciendo que pueda crecer en cualquier ámbito.
«El mercado global de los altavoces “inteligentes”»

El futuro de los asistentes de voz y los altavoces “inteligentes”

Se estima que 123,5 millones de adultos en EE. UU. utilizarán asistentes de voz al menos una vez al mes en 2022, siendo los smartphones y los altavoces inteligentes los dispositivos más utilizados para acceder a ellos. Los asistentes de voz en smartphones son más populares que en altavoces inteligentes. Google lidera en cantidad de usuarios de asistentes de voz, seguido de cerca por Amazon y Apple

El mercado de asistentes de voz está en crecimiento, aunque las preocupaciones sobre privacidad y ética han frenado su adopción. Amazon lidera el mercado de altavoces inteligentes en EE. UU., pero otras empresas como Apple y Sonos están ganando terreno. La compra por voz aún tiene un interés bajo entre los consumidores, y la adopción de estas tecnologías dependerá de cómo se aborden las preocupaciones sobre privacidad y seguridad.

La adopción de asistentes de voz es más alta entre los millennials de 25 a 34 años. El crecimiento futuro dependerá de nuevos productos y avances en tecnologías como el procesamiento del lenguaje natural (NLP). La aparición de tecnologías como GPT podría cambiar la distribución del mercado, este 2023 será un punto de inflexión tanto para el software como el hardware de los asistentes de voz.

¿Y a mi esto que me aporta?

Algunas pinceladas:

  • En el terreno del marketing y comunicación, debemos prestar atención a cómo la adopción de tecnologías como GPT puede mejorar la experiencia del usuario en el ámbito de los asistentes de voz y considerar colaboraciones con empresas de IA para mantener su ventaja competitiva. Además, debemos estar atentos a las tendencias de los consumidores y ajustar sus campañas publicitarias y de comunicación para reflejar las expectativas de un público cada vez más familiarizado con asistentes más avanzados y conversacionales.
  • En el terreno de los negocios y el emprendimiento, debemos buscar nichos de mercado específicos donde GPT y tecnologías similares puedan aportar valor. Por ejemplo, desarrollando aplicaciones para dispositivos móviles o servicios de atención al cliente que aprovechen la capacidad de GPT para mantener conversaciones más naturales y personalizadas. También estar preparados para reaccionar rápidamente a las tendencias emergentes, y adaptar sus modelos de negocio en consecuencia, considerando alianzas estratégicas con empresas líderes en IA para mantenernos relevantes en el mercado.
  • En el terreno personal, podemos aprender de la experiencia de empresas como Amazon, Apple y Google en términos de adaptabilidad y apertura al cambio. Por ejemplo, podemos buscar formación en tecnologías emergentes como IA y asistentes de voz para mejorar nuestro conjunto de habilidades y aumentar nuestra empleabilidad en el mercado laboral. También podemos experimentar con el uso de asistentes como GPT en nuestra vida diaria para aumentar nuestra productividad y eficiencia, como en la organización de nuestras tareas, en la investigación de temas de interés o en la automatización de ciertas actividades en nuestro hogar inteligente.

Lecturas complementarias, seleccionadas y resumidas para ti:

Libros complementarios: seleccionados para ti:

  • Voicebot and Chatbot Design de Rachel Batish es una guía integral para diseñar y desarrollar asistentes de voz y chatbots efectivos e intuitivos. El libro cubre las mejores prácticas y estrategias en la creación de interfaces de voz y texto, utilizando tanto la inteligencia artificial como el aprendizaje automático. A lo largo del libro, se presentan ejemplos y estudios de caso para ilustrar cómo crear experiencias de usuario exitosas y cómo abordar desafíos comunes, como la comprensión del lenguaje natural y la personalización de las interacciones.
  • Talk to Me: How Voice Computing Will Transform the Way We Live, Work, and Think de James Vlahos es un libro fascinante que explora cómo la computación por voz está cambiando nuestra relación con la tecnología y cómo afectará nuestras vidas en el futuro. Vlahos presenta una investigación exhaustiva sobre los asistentes de voz como Siri, Alexa y Google Assistant, analizando tanto sus orígenes como sus implicaciones éticas y sociales.