OpenAI anuncia su nueva IA o1 con capacidades increibles

PhDfailer

Para el nuevo modelo de IA han combinado el enfoque de transformers+Reinforcement Learning para alcanzar un razonamiento superior.

OpenAI afirma lo siguiente:

OpenAI o1 se ubica en el percentil 89 en preguntas de programación competitiva (Codeforces), se encuentra entre los 500 mejores estudiantes de EE. UU. en una eliminatoria para la Olimpiada Matemática de EE. UU. (AIME), y supera la precisión a nivel de doctorado humano en un conjunto de problemas de física, biología y química (GPQA). Aunque aún se está trabajando para hacer que este nuevo modelo sea tan fácil de usar como los modelos actuales, estamos lanzando una versión preliminar de este modelo, OpenAI o1-preview, para su uso inmediato en ChatGPT y para usuarios confiables de la API.

Nuestro algoritmo de aprendizaje por refuerzo a gran escala enseña al modelo a pensar de manera productiva utilizando su cadena de razonamiento en un proceso de entrenamiento altamente eficiente en el uso de datos. Hemos descubierto que el rendimiento de o1 mejora consistentemente con más aprendizaje por refuerzo (cómputo en el tiempo de entrenamiento) y con más tiempo dedicado a pensar (cómputo en el tiempo de prueba). Las restricciones para escalar este enfoque difieren sustancialmente de las del preentrenamiento de modelos de lenguaje grandes (LLM), y seguimos investigándolas.

Fuente:
https://openai.com/index/learning-to-reason-with-llms/

Opinión personal:
Cada vez más cerca de AGI, da miedito si no se piensa un nuevo modelo económico donde los ciudadanos no dependan del trabajo.

2
SuperMatute

Las paguitas empezaron hace ya tiempo y con el tiempo irán en aumento y después llegará skynet y nos follará el culo a base de bien

2
Artemax

24 1 respuesta
PhDfailer

BioGnomic

Bien, mi doctorado cada vez vale menos, en unos meses lo mismo que una cuenta free de chatgpt

4 1 respuesta
newfag

Habrá que verlo para creerlo, las gráficos muestran un avance brutal.

1 respuesta
PhDfailer

#5 Puedes ir aprendiendo albañileria, fontaneria, electrónica para montar servidores para nuestro IA overlord...

#6 Se supone que de aquí a dos semanas, los usuarios de Chat GPT Plus, lo tendremos (o1 preview). Ya hay algunos con acceso.

PhDfailer

Aquí pensando durante un minuto y medio

Leed la página 11 de este documento informativo:

https://cdn.openai.com/o1-system-card.pdf

Acojona.

Based on these findings, Apollo Research believes that o1-preview has the basic capabilities needed
to do simple in-context scheming 2—scheming which tends to be legible in the model outputs.
Based on interactions with o1-preview, the Apollo team subjectively believes o1-preview cannot
engage in scheming that can lead to catastrophic harms3
, although current evals aren’t designed
to definitively rule this out. Although Apollo Research does not believe that o1-preview is capable
of causing catastrophic harm via scheming, they recommend setting up basic monitoring for
in-chain-of-thought scheming during deployment in agentic high-stakes settings such as automated
AI research for next-generation frontier models. This is in part to better understand the risk of
current models as well as to prepare such a monitoring pipeline for more capable future models.
Carrying out monitoring for such purposes is an ongoing area of research and has various open
challenges (see Section 3.2.1 for results on early such experiments OpenAI has conducted).

2.Scheming which tends to be legible in the model outputs.

  1. Scheming that could lead to severe unintended consequences.
3 respuestas
TripyLSD

#3 more like

20
Kike_Knoxvil

28 1 respuesta
r2d2rigo

#8 92 segundos pensando una frase que no tiene sentido gramatical, bravisimo.

2 1 respuesta
kreigon

11 segundos para pensar qué día es hoy. Ni tan mal, eso sí, solo me ha dejado hacerle esa pregunta.

tute07011988

Con el video ese en el que tarda minuto y medio en escribir, no sé si es un trolleo o es que de verdad yo no veo el valor de tal logro tecnológico :/

3
ercabesa

es una pasada, es subir un peldaño importante

Fyn4r

#11 han cambiao una barra de progreso de 0-100% por frases aleatorias que suena chulis y venga, a facturar

6
wizar5

#10 bueno yo le hice una foto a mi perro, y me supo decir hasta decir que tipo de perro es

Exor720

Nos vamos a la verguisima

susto93

Esto es el sucesor de chatgpt4?

1 respuesta
crb2222

#18 no, es un modelo de razonamiento no de lenguaje, a la larga serán complementarios dentro de algo mayor

1
sPoiLeR

#8 Me parece un salto brutal de la versión anterior, increible avance mostrado en el video.

GaN2

8
UsuarioD2024

Con estos temas me pregunto continuamente cuanto merecerá la pena empezar en la actualidad o futuro a formarte como programador si vas a ser muy mediocre, no me cabe duda de que a la gente muy preparada y que lleva años les sobrará el trabajo, ¿pero hasta que punto y hasta cuando tendrá sentido contratar a alguien que a sacado una FP y ya? Digo lo de programación por decir algo y por estar en ese escenario, pero inserte materia "x" y no solo una FP, sino algo que lleve mucho más como el citado doctorado.

1 3 respuestas
cabron

#22

a día de hoy? sigue mereciendo la pena totalmente, no te dejes engañar por el hype.

Esto es una herramienta, mucho más útil que tirarse 20 minutos buscando en google y leyendo blogs y stackoverflow, pero sigue siendo una herrramienta que necesita que se use de forma correcta, si pones a alguien que no tenga ni idea que haga todo a base de lo que le diga chatgpt montas una gorda, a día de hoy no es viable usarlo sin formación para nada que sea medio serio

20
isPaiN_

Veo a mucha gente nerviosa. Por lo general eso suele significar que algo están haciendo bien los que les ponen nerviosos.

1 respuesta
Blue_ogre

Yo lo veo guay, que meta mierdas random lo hace casi humano 🤣.

A ver que es una nueva linea de investigación, con el tiempo irá mejorando o al menos lo intentarán.

Darurg

#24 da igual cuanto lo mejoren, nunca conseguiremos reducir el número de funcionarios.

4
PhDfailer

Ya lo tengo disponible. Es una versión preview limitada, pero yo, que lo uso a diario, noto bastante mejora respecto a 4o.

Cuando tenga más tiempo para probrarlo os contaré. Se siente como tener un amigo que sabe mucho más que tú de la mayoria de los temas.

wolfie6949

15$ el millón de tokens de entrada y 3$ para su versión mini si lo usas por API (es mi caso). Ni me imagino lo que tiene que tragar.

De momento esperaré sentado.

1 respuesta
Nirfel

¿Como de complejo son los códigos que puede programar?

1mP

Se vienen las leyes de la robótica de Isaac Asimov.

Team robotin desde shikito