Claude Mythos gera debate sobre marketing e benchmarks da Anthropic
Desenvolvedores discutem se novo modelo é estratégia publicitária ou avanço real, enquanto GPT-5.3 se aproxima e LLMs ajudam em pesquisa matemática.
Fabrício Carraro destacou os resultados do Claude Mythos como "talvez o gráfico mais significativo" do novo modelo da Anthropic, mas a reação do grupo foi de ceticismo quanto às intenções da empresa.
Marcell Almeida foi direto: "esse papo de não disponibilizar o modelo, lançar esse projeto com vídeo do CEO etc etc me cheira a marketing stunt". Carraro concordou que é marketing, mas ponderou que "a questão de terem liberado os benchmarks e o system card completíssimo, mostra que não é só marketing".
A discussão evoluiu para a competição no setor. Almeida mencionou que "tão falando bem do novo modelo da GPT" e especulou sobre as próximas jogadas: "se duvidar vão inventar um jeito de disponibilizar o mythos". Paulo Silveira fez a conexão temporal: "bem pertinho do IPO".
Em paralelo, Silveira trouxe aplicações acadêmicas dos LLMs, mencionando Guilherme Silveira "no IMPA, dando aula sobre uso de LLMs para provar conjecturas em aberto em sistemas dinâmicos". Guilherme esclareceu que está "refutando uma conjectura moderna de 2023 sobre a finitude de parâmetros para os quais uma família de sistemas dinâmicos discretos possui determinados períodos".