Icon Newsletter

Buzzwords:
Convierte el ruido tecnológico en conocimiento accionable.

Aquí puedes leer la edición 6

ūüßŅ ¬ŅD√≥nde han quedado Alexa y Siri? ¬ŅAmazon y Apple ya no son punteros en IA?

Amazon y Apple niegan estar atrasados en IA y dicen que millones de personas usan Alexa y Siri cada día, lo que demuestra que a la gente le gusta. Pero desde que apareció GPT, Amazon ha estado buscando maneras de mejorar la IA de Alexa, incluso hablando con startups de IA. Está intentando un golpe de efecto como el de Microsoft como OpenAI, que no es descartable, pero que no le será nada fácil.

Google tambi√©n se ha sorprendido con GPT y ha lanzado su propio chatbot: Bard. Aunque GPT tiene sus fallos, muchos creen que representa un cambio en IA y que mejorar√° con el tiempo. Si no se ponen las pilas, Amazon, Apple y Google podr√≠an acabar como otras empresas que fueron superadas por sus rivales en tecnolog√≠a. Sus negocios pueden estar en peligro. 

Si Amazon logra integrar algo como GPT en Alexa, podr√≠a hacerla m√°s conversacional y personalizada. La Alexa del futuro podr√≠a resumir mejor los art√≠culos de Internet o reconocer m√°s comandos para el hogar inteligente. Pero como coment√°bamos antes Alexa trabaja en un marco delimitado que es su hardware y su software. Es m√°s realista pensar que GPT ‚Äúcorra‚ÄĚ en asistentes de voz a que los asistentes de voz mejoren tanto como GPT. Pero eso no ser√° negocio para Amazon, porque su objetivo no es vender hardware, si no que su software sea un negocio en s√≠ mismo.

Aunque hay retos con tecnologías como GPT, Amazon sigue siendo líder en el mercado de asistentes de voz y tiene una gran base de dispositivos en los que está disponible. Los modelos de gran lenguaje como GPT parecen más humanos, pero también son más difíciles de controlar que sistemas como Alexa.

¬ęEl mercado de los asistentes de voz en Estados Unidos, Inglaterra y Alemania¬Ľ

¬ŅQu√© entendemos por asistentes virtuales impulsados por la inteligencia artificial?

Alexa y Siri son asistentes virtuales creados por Amazon y Apple, respectivamente. Ambos emplean tecnologías de inteligencia artificial (IA) para ofrecer una amplia gama de funcionalidades a sus usuarios. Se basan básicamente en tres tecnologías:

  • En plan sencillo: Alexa y Siri son como amigos que entienden lo que dices, gracias a algo llamado NLP. Ellos recogen las palabras y las analizan para saber qu√© quieres.
  • Luego est√° el ASR, que es como si le hablas a alguien y esa persona escribe lo que le dices. As√≠, puedes hablar con Alexa y Siri en vez de escribirles.
  • El TTS es al rev√©s: cuando los asistentes te responden, convierten el texto en voz para que lo escuches.

Nos vendieron que estos ‚Äúnuevos amigos‚ÄĚ aprender√≠an de ti y de otros usuarios, para que cada vez fuesen m√°s listos y nos entendiesen mejor. Esa promesa, en gran parte, ha fracasado. 

¬ŅDe d√≥nde vienen los asistentes de voz?

Parece que fue ayer, pero no.

Cuando Alexa sali√≥ en 2014, muchos pensaban que ser√≠a la pr√≥xima gran plataforma despu√©s de los smartphones. Sin embargo, no ha sido tan rentable como se esperaba, y sus principales usos siguen siendo b√°sicos, como poner m√ļsica o temporizadores. Siri de Apple y Echo de Google tampoco lo han hecho mucho mejor.

Dos a√Īos despu√©s del lanzamiento del primer dispositivo con Alexa, Jeff Bezos afirm√≥ que el asistente de voz ten√≠a la capacidad de transformarse en una ¬ęcuarta columna¬Ľ en el negocio de la empresa, aportando de manera considerable a los resultados de Amazon junto con el comercio electr√≥nico, la suscripci√≥n Prime y los servicios en la nube.

Amazon creía que Alexa le iba a generar ingresos de dos maneras:

  • Creando un ecosistema de aplicaciones como el de Apple y Google con sus stores, pero Amazon tiene s√≥lo 130.000 skills (es como llama a sus apps) , en comparaci√≥n con los m√°s de 2 millones de aplicaciones en la App Store y lo mismo en Google Play.
  • Con publicidad. Amazon gan√≥ mucho en publicidad, pero la mayor√≠a viene de su sitio web, no de Alexa. A la gente le gusta poner anuncios en Amazon.com y en sus videos, pero no tanto en Alexa.

¬ŅEn qu√© se parecen y en que no las tecnolog√≠as de los asistentes de voz y tecnolog√≠as como GPT-4?

Los asistentes de voz y tecnologías como GPT-4 comparten algunas similitudes y diferencias. Veamos en qué se parecen y en qué no:

Similitudes:

  • Ambos utilizan NLP, o Procesamiento del Lenguaje Natural: Tanto los asistentes de voz como GPT-4 emplean tecnolog√≠as de NLP para comprender, analizar y generar texto en lenguaje humano. Aunque aqu√≠ se est√° demostrando que OpenAI a conseguido mejores modelos de NLP.
  • Aprendizaje autom√°tico y aprendizaje profundo: Los asistentes de voz y GPT-4 se basan en algoritmos de aprendizaje autom√°tico y aprendizaje profundo, como las redes neuronales, para mejorar su rendimiento y adaptarse a las necesidades de los usuarios.
  • Interacci√≥n con el lenguaje humano: Ambos est√°n dise√Īados para interactuar con los usuarios utilizando lenguaje humano, ya sea mediante texto o voz, y proporcionar respuestas o realizar acciones seg√ļn las consultas de los usuarios.

Diferencias:

  • Entrada de audio vs. entrada de texto: Los asistentes de voz, como Alexa y Siri, est√°n dise√Īados para procesar entradas de audio mediante el uso de tecnolog√≠as de ASR, o Reconocimiento Autom√°tico de Voz. Es una tecnolog√≠a que ayuda a los cacharros, como los asistentes virtuales, a entender lo que les dices en vez de tener que escribirles. Por otro lado, GPT-4 es un modelo de lenguaje basado en texto que trabaja principalmente con texto escrito.
  • Funcionalidades espec√≠ficas vs. generaci√≥n de texto: Los asistentes de voz est√°n dise√Īados para realizar tareas espec√≠ficas, como responder preguntas, reproducir m√ļsica o controlar dispositivos inteligentes. Es lo que se denomina TTS, o Text-to-Speech (texto a voz). GPT-4, en cambio, se centra en generar texto de manera coherente y contextualmente relevante, pudiendo adaptarse a una amplia variedad de aplicaciones y tareas. Vamos a poder conectar otras tecnolog√≠as con GPT-4, con la reci√©n anunciada ‚Äústore‚ÄĚ de aplicaciones.
  • Integraci√≥n con servicios y dispositivos: Los asistentes de voz suelen estar integrados con servicios y dispositivos espec√≠ficos (por ejemplo, Siri en dispositivos Apple y Alexa en dispositivos Amazon). GPT-4 es un modelo de lenguaje general que puede ser implementado en diversas aplicaciones y plataformas. En esencia es transversal, y eso est√° haciendo que pueda crecer en cualquier √°mbito.
¬ęEl mercado global de los altavoces ‚Äúinteligentes‚Ä̬Ľ

El futuro de los asistentes de voz y los altavoces ‚Äúinteligentes‚ÄĚ

Se estima que 123,5 millones de adultos en EE. UU. utilizar√°n asistentes de voz al menos una vez al mes en 2022, siendo los smartphones y los altavoces inteligentes los dispositivos m√°s utilizados para acceder a ellos. Los asistentes de voz en smartphones son m√°s populares que en altavoces inteligentes. Google lidera en cantidad de usuarios de asistentes de voz, seguido de cerca por Amazon y Apple

El mercado de asistentes de voz est√° en crecimiento, aunque las preocupaciones sobre privacidad y √©tica han frenado su adopci√≥n. Amazon lidera el mercado de altavoces inteligentes en EE. UU., pero otras empresas como Apple y Sonos est√°n ganando terreno. La compra por voz a√ļn tiene un inter√©s bajo entre los consumidores, y la adopci√≥n de estas tecnolog√≠as depender√° de c√≥mo se aborden las preocupaciones sobre privacidad y seguridad.

La adopci√≥n de asistentes de voz es m√°s alta entre los millennials de 25 a 34 a√Īos. El crecimiento futuro depender√° de nuevos productos y avances en tecnolog√≠as como el procesamiento del lenguaje natural (NLP). La aparici√≥n de tecnolog√≠as como GPT podr√≠a cambiar la distribuci√≥n del mercado, este 2023 ser√° un punto de inflexi√≥n tanto para el software como el hardware de los asistentes de voz.

¬ŅY a mi esto que me aporta?

Algunas pinceladas:

  • En el terreno del marketing y comunicaci√≥n, debemos prestar atenci√≥n a c√≥mo la adopci√≥n de tecnolog√≠as como GPT puede mejorar la experiencia del usuario en el √°mbito de los asistentes de voz y considerar colaboraciones con empresas de IA para mantener su ventaja competitiva. Adem√°s, debemos estar atentos a las tendencias de los consumidores y ajustar sus campa√Īas publicitarias y de comunicaci√≥n para reflejar las expectativas de un p√ļblico cada vez m√°s familiarizado con asistentes m√°s avanzados y conversacionales.
  • En el terreno de los negocios y el emprendimiento, debemos buscar nichos de mercado espec√≠ficos donde GPT y tecnolog√≠as similares puedan aportar valor. Por ejemplo, desarrollando aplicaciones para dispositivos m√≥viles o servicios de atenci√≥n al cliente que aprovechen la capacidad de GPT para mantener conversaciones m√°s naturales y personalizadas. Tambi√©n estar preparados para reaccionar r√°pidamente a las tendencias emergentes, y adaptar sus modelos de negocio en consecuencia, considerando alianzas estrat√©gicas con empresas l√≠deres en IA para mantenernos relevantes en el mercado.
  • En el terreno personal, podemos aprender de la experiencia de empresas como Amazon, Apple y Google en t√©rminos de adaptabilidad y apertura al cambio. Por ejemplo, podemos buscar formaci√≥n en tecnolog√≠as emergentes como IA y asistentes de voz para mejorar nuestro conjunto de habilidades y aumentar nuestra empleabilidad en el mercado laboral. Tambi√©n podemos experimentar con el uso de asistentes como GPT en nuestra vida diaria para aumentar nuestra productividad y eficiencia, como en la organizaci√≥n de nuestras tareas, en la investigaci√≥n de temas de inter√©s o en la automatizaci√≥n de ciertas actividades en nuestro hogar inteligente.

Lecturas complementarias, seleccionadas y resumidas para ti:

Libros complementarios: seleccionados para ti:

  • Voicebot and Chatbot Design de Rachel Batish es una gu√≠a integral para dise√Īar y desarrollar asistentes de voz y chatbots efectivos e intuitivos. El libro cubre las mejores pr√°cticas y estrategias en la creaci√≥n de interfaces de voz y texto, utilizando tanto la inteligencia artificial como el aprendizaje autom√°tico. A lo largo del libro, se presentan ejemplos y estudios de caso para ilustrar c√≥mo crear experiencias de usuario exitosas y c√≥mo abordar desaf√≠os comunes, como la comprensi√≥n del lenguaje natural y la personalizaci√≥n de las interacciones.
  • Talk to Me: How Voice Computing Will Transform the Way We Live, Work, and Think de James Vlahos es un libro fascinante que explora c√≥mo la computaci√≥n por voz est√° cambiando nuestra relaci√≥n con la tecnolog√≠a y c√≥mo afectar√° nuestras vidas en el futuro. Vlahos presenta una investigaci√≥n exhaustiva sobre los asistentes de voz como Siri, Alexa y Google Assistant, analizando tanto sus or√≠genes como sus implicaciones √©ticas y sociales.