Respondiendo preguntas IA, algoritmos, ChatGPT y privacidad

Muy buenos días y bienvenidos a Inteligencia Artificial. El podcast donde hablamos del presente y el futuro de la inteligencia artificial, analizamos casos donde ya se están usando estas tecnologías y vemos cómo podemos aplicarlo en el día a día de nuestros trabajos, proyectos y empresas. 

Yo soy Pocho Costa, ingeniero en sistemas, programador y amante de la tecnología y me podés encontrar en pochocosta.com donde ahí también vas a encontrar las notas del programa y otros medios para ponerte en contacto conmigo. Empezamos.

Buenas buenas! como andan! espero que muy bien! Acá estamos de nuevo con otro episodio de Inteligencia Artificial y hoy me voy a dedicar a responder preguntas de las que me fueron enviando a oyentes arroba pochocosta.com. En realidad hoy iba a hablar de otro tema pero no quería dejar que se sigan acumulando preguntas así que lo otro lo dejamos para la semana que viene.

Por cierto como el episodio pasado donde hablé de las GPT Actions gustó mucho y me dejaron varios comentarios pidiendo que haya un video para explicarlo paso a paso, dejo en las notas del programa en pochocosta.com/podcast el link al tutorial que puse en Youtube explicando como configurar las GPT Actions para conectar a los GPTs con aplicaciones externas. Así que si les gusta no se olviden de dejarme un link en el video.

Y ahora sí pasemos a las preguntas. 

Vamos con la primera que dice así:

  1. Hola Pocho,

Me llamo Ricardo y soy un fiel oyente del podcast, me encantan los episodios que haces. Me han sido de gran ayuda para aprender de inteligencia artificial. Quería comentarte un tema a ver si lo podrias responder en uno de los episodios.

Últimamente, he intentado usar ChatGPT para que lea y resuma información de páginas web. Le doy un enlace, pero cada vez que lo hago, recibo errores o respuestas que indican que no puede acceder al contenido del enlace. Pensé que ChatGPT podría navegar por internet y leer páginas web directamente desde los enlaces que le doy, pero no se como debo hacerlo.

¿Habrá algo que estaré haciendo mal?

Gracias por tu tiempo y por todo el conocimiento que compartes en tu podcast.

Saludos, Ricardo.

Bueno Ricardo, muchas gracias por tus palabras, me alegra que te guste el podcast. En cuanto a tu consulta, no especificas si estas usando ChatGPT versión gratuita o la versión GPT-4 que viene en la suscripción de ChatGPT Plus. Aunque por lo que comentás intuyo que debe ser la versión paga porque te da un error, en cambio la versión gratuita te dice que no puede navegar y que tiene contenido hasta tal fecha.

Y resulta que hace unos días había dejado de funcionar la capacidad de navegar en internet de GPT-4 o en realidad estaba bastante limitada y se creo que fue debido a una demanda que le hizo el New York Times a OpenAI por usar su contenido para entrenar los modelos. Ahora ya está funcionando nuevamente, pero por las dudas te digo como había hecho para saltearme esa limitación por si este problema vuelve a pasar y quizas la solución sigue funcionando.

Básicamente lo que podías hacer en vez de dar el link directamente, era decirle que use su capacidad de navegar en internet para buscar un artículo sobre el tema del link que vos querías abrir, y darle alguna parte textual del artículo o del título para que sea más acertado a la hora de buscar. Y de esa manera se había podido saltear el error. Yo esto mismo lo dejé en un video corto en Youtube en el momento en que lo detecté por si a alguien más le servía, así que dejo el link también en las notas por si quieren ver las capturas de pantalla de como era el error.

Así que vayamos con la siguiente pregunta que dice así:

  1. Hola Pocho, 

Un gusto saludarte 🙂 te quiero hacer una consulta muy puntual. 

Tengo un set de 5000 nombres de compañías, con 4 columnas que contienen la siguiente información:

1. El nombre oficial de las compañías

2. El resultado de un algoritmo de procesamiento que se usa para convertir esos nombres oficiales en nombres más casuales sin perder el sentido del nombre de la compañía

3. Una etiqueta que califica qué tan bien o mal lo hizo el algoritmo

4. La salida correcta que se esperaba del algoritmo

Esto está hecho con el propósito de mejorar el algoritmo por medio de varias iteraciones, donde cada vez se repetirá la evaluación de 5000 ejemplos, pero yo creo que hay un camino más «corto» y mejor usando un modelo de machine learning supervisado (pues tengo las etiquetas y el resultado esperado), pero no sé si estoy pensando en el enfoque apropiado. Las preguntas son: 

¿Te parece una buena idea usar un modelo de Machine Learning? 

¿Qué modelos y herramientas me puedes recomendar para abordar esto? 

Muchas gracias por tu tiempo,

Saludos 

Jessica 

Veamos Jessica, si yo no entendí mal vos lo que estás queriendo hacer es transformar un nombre de compañía en otro nombre sin perder el sentido de la compañía. Con lo cual estamos hablando de una transformación de texto. Por lo que si no estoy entendiendo mal el problema, yo me iria por usar algún modelo de lenguaje puede ser alguno open source que encuentres en Hugging face y e intentaría usar la lógica de ese algoritmo en el modelo de lenguaje para que genere los nombres casuales u otra alternativa sería usar ese dataset de 5000 ejemplos para hacer un fine tuning.

Asi que bueno, espero que esto te haya servido de ayuda y contame despues si entendí bien el problema, que te parece este aproach que te comento y si lo probas decime que tal te resultó.

Vamos con la siguiente que dice:

Hola Pocho, cómo estás?

Primero agradecerte por el post me ha sido de gran ayuda para ir entendiendo la IA.

Quería preguntarte cómo puedo estar seguro de que al utilizar las herramientas como ChatGPT los datos de la empresa que pueden ser confidenciales no estén siendo obtenidos por la tecnología? Existe alguna manera de protegerse? Tengo ganas de empezar a realizar cosas en mis procesos pero mi área legal no está tan segura.

Te agradezco si me pudieras guiar o quizás si ya has hecho un post con respecto a esto me digas cuál es, por favor.

Nuevamente muchas gracias y por favor no pares con el podcast.

Saludos

Hugo

Bueno Hugo te cuento, que cuando entras a ChatGPT por primera vez te sale un modal con 3 mensajes y uno de esos dice que no compartas información sensible porque los chats podrían ser revisados por sus operadores o incluso podrían usarlos para entrenar sus modelos. Y ahí te dejan unos links donde explican toda la política en detalle. Te los dejo en las notas por si queres revisar el tema más a fondo.

Por otra parte te cuento que si vas a la parte de configuración, vas a encontrar una sección que se llama “data controls”, y ahi tenes un control para desactivar el uso de tus conversaciones para entrenamiento, aunque tenes que tener en cuenta que si activas esto tambien perdes la historia de las conversaciones que te aparecen en la barra lateral izquierda.

Ahora bien, esto pasa con las cuentas gratuitas y con la de la suscripción plus, pero tambien tenes la suscripción para empresa que en esa tenes protección de datos asegurada y también hace unos días sacaron una suscripción para equipos de por lo menos dos personas donde dicen explícitamente también que no usan tus datos para entrenamiento y además te permiten la posibilidad de compartir los GPTs personalizados con el resto de tu equipo.

Esto Hugo te recomiendo que lo revise a detalle el area legal de tu empresa. Aunque otra opción que podes analizar es usar un modelo de lenguaje local en tu maquina. 

Esto lo podes hacer usando una aplicación que se llama LM Studio y con ella descargar un modelo open source. De esta manera todo queda en tu empresa y nunca nada sale a internet. 

De momento no es tan potente como GPT-4 pero de todas maneras te puede ser útil.

Así que bueno Hugo, espero que te haya sido de utilidad la respuesta.

Y ahora sí, vamos con la última que dice así:

Que tal Pocho, estoy empezando un negocio de soluciones de inteligencia artificial para todo tipo de industria. Mi primer cliente será una empresa que quiere que le desarrolle un modelo de visión para su área de calidad. La idea es que pueda recibir como input una imagen y clasificar si la imagen está en buenas condiciones o si tiene algún defecto.

Ya hice un modelo prototipo usando Keras, lo pusimos a prueba de manera informal y los resultados fueron excelentes. Sin embargo tengo dudas de cuanto cobrar por un modelo así, también me gustaría saber si necesito pagar algún tipo de licencia a tensorflow o keras para poder monetizar con el modelo.

Me gusta mucho tu podcast, espero tu respuesta, saludos desde México. Armando.

Bueno Armando muchas gracias por tu pregunta y felicitaciones por tu proyecto y tu primer cliente!

En cuanto a tu pregunta, no me queda claro si vos esto lo vas a vender como un software as a service o es un servicio de desarrollo a medida.

Porque si es un desarrollo a medida las opciones más comunes son Fixed Price o Time and Materials. En fixed price vos le dirias un precio total al cliente y en el time and materials sería un precio por las horas de trabajo que efectivamente te lleve desarrollarlo y a eso se le sumarían los materiales, en este caso serían todos los costos de infraestructura, GPU y esas cosas.

En el primer caso que es el de precio fijo, tendrias que estimar bien el proyecto, incluir todas las fases y sumar todos los costos para llegar al precio final. No hay que olvidarse de contemplar impuestos y todo lo que haga falta.

En cualquiera de los dos casos tenes que tener bien claro tu precio hora.

Y después la otra opción que es la de software as a service, ahi ya es más complejo porque vos tendrias que hacerte cargo de mantener esta infra en la nube, y que como todo en la nube depende de la escala que tenga la solución porque no es lo mismo si tenes que atender una llamada por minuto que cien llamados por minuto.

Con lo cual ahi tenes que hablar con tu cliente para entender bien eso y en ese caso supongo que vas a usar alguna nube para alojar toda la solución, ahí vas a poder usar las calculadoras que te dan para cargar todos los servicios que vas a usar y cuanto lo vas a usar para calcular el costo y en base a eso después hacer las cuentas para a ese costo sumarle algún extra que va a ser tu ganancia y usar ese precio para cobrar.

Por lo generar en los SaaS a veces tenes como dos modalidades, una que es como por planes básico, plata, bronce, oro, y cada uno tiene un precio fijo y una cantidad de uso que le podes dar, y el otro es el famoso pay as you go donde te cobran por cada llamado.

Así que esas son las alternativas que se me ocurren y que podes evaluar.

Esto es muy delicado igual, así que te sugiero que te sientes con tranquilidad y hagas bien todos los cálculos.

Y muchos exitos con eso Armando!

Y bueno gente con esto llegamos al final del episodio, recuerden si quieren pueden enviar sus preguntas a oyentes arroba pochocosta.com

Y bueno, espero que les haya gustado este episodio. Suscríbanse a la newsletter para estar al tanto de todas estas novedades de inteligencia artificial cada semana. Y si les gustó el episodio les pido que lo compartan con su gente. Si no lo hicieron que dejen 5 estrellitas en Spotify, eso ayuda a que el podcast sea descubierto por más personas. 

Y ahora sí, nos escuchamos en el próximo episodio donde seguiremos hablando de este hermoso mundo de la inteligencia artificial.