Especial inteligência artificial

POR QUE A IA NÃO PODE ESCREVER ESTE ARTIGO (AINDA)?

AS MÁQUINAS ESTÃO APRENDENDO CADA VEZ MAIS RÁPIDO E MELHOR, MAS ELAS AINDA SÃO LIMITADAS.

Por Walter Frick

Roger Schank, pesquisador e ex-professor, certa vez propôs um novo objetivo para a IA: um computador deveria ser capaz de assistir a Amor, sublime amor e reconhecer a trama de Romeu e Julieta. Schank e seus alunos acreditavam que histórias são essenciais para a inteligência, o raciocínio e o propósito. De acordo com a avaliação de Schank, a IA atual não é totalmente inteligente.

Atualmente a IA funciona formulando tarefas como problemas de previsão e depois utilizando técnicas estatísticas e uma quantidade enorme de dados para fazer previsões. Um exemplo simples de um problema de previsão baseado em texto é o autopreenchimento. Quando eu digito “com quem” numa mensagem de texto, meu telefone celular utiliza dados e modelagem estatística para prever o que vem a seguir. Ele oferece “você”, ou “ele” ou “posso”. “Você” é o que eu tinha em mente e, uma vez que seleciono a palavra, meu telefone continua a prever a próxima palavra. Dessa vez ele está tão confiante de que vou selecionar “vai” (no que está certo) que nem oferece outras opções, mas em vez disso segue para a palavra seguinte sugerindo “almoçar” ou “sair hoje”. No aprendizado de máquina, problemas de predição como este são chamados de aprendizado supervisionado. Dado um conjunto de dados contendo a resposta certa — inúmeras mensagens de texto completadas —, um algoritmo aprende a reconhecer padrões, de modo que “sair hoje” geralmente segue “com quem”. (Outro tipo de aprendizado de máquina, o aprendizado não supervisionado, funciona de forma diferente, mas o aprendizado supervisionado tem sido o responsável pela maior parte do progresso recente na área.)

No entanto, o processo de redigir um artigo para uma revista não pode ser facilmente transformado num problema de previsão pelo menos, não ainda. Como Sam Bowman, professor da New York University, se referiu numa recente conferência sobre IA e jornalismo, “a noção de realmente gerar longos textos coerentes, sem um modelo especificamente jornalístico muito claro, ainda está muito distante”. Pesquisadores mostraram que o aprendizado de máquina pode gerar um texto coerente em condições específicas, observa Bowman, mas “criar realmente sistemas capazes de discorrer partindo de uma ideia abstrata ou de um conjunto de fatos para criar um texto longo e coerente ainda é tarefa muito difícil”

Para ilustrar essa dificuldade, Bowman mostrou um roteiro, intitulado Sunspring, escrito no ano passado usando aprendizado de máquina. O roteiro foi gerado com base em dezenas de obras de ficção científica que alimentaram uma rede neural — um tipo de algoritmo de aprendizado de máquina — no nível do personagem, e isso significa que a unidade de dados de onde o algoritmo estava aprendendo era o único personagem desse texto. Considerando os personagens que tinham aparecido antes, o algoritmo estava aprendendo a prever que personagem deveria vir a seguir. O resultado você pode conhecer no vídeo disponível no site da HBR Brasil. Vale a pena.

Já é impressionante o fato de os atores de Sunspring estarem dizendo palavras reais em inglês (mesmo que elas não façam muito sentido). Antes de a rede neural “ler” esses roteiros, ela não só não sabia escrever um roteiro, como também não conhecia a língua inglesa. Ela aprendeu algumas das características do roteiro — por exemplo, que linhas de texto devem ser atribuídas aos personagens e que a direção de cena deveria ser incluída. Vale repetir, ela aprendeu tudo isso apenas lendo algumas dezenas de roteiros. 

O que ela não captou de todos esses roteiros foi a arte da narrativa. Sunspring não conta uma história. Seus personagens existem somente porque lhes foram atribuídas falas. O roteiro mostra até que ponto o aprendizado de máquina precisa ir antes de dominar o enredo de uma história, ou tornar-se “inteligente”. No entanto, a capacidade do algoritmo de construir frases e de reconhecer aspectos básicos de um roteiro sugere que a IA poderá desempenhar um papel importante no futuro da redação. Mas esse futuro, pelo menos no curto prazo, é limitado.

RESUMOS GERADOS POR AI
Uma área da redação na qual o aprendizado de máquina está progredindo mais é em resumos. Descobrir as partes mais importantes de um texto e produzir um resumo é tarefa de redação extremamente comum: equipes de editores compilam clips das notícias do dia, repórteres resumem desenvolvimentos prévios enquanto escrevem uma matéria, think tanks resumem um novo estudo, editores de livros resumem um capítulo. Algumas dessas tarefas já podem ser executadas por máquinas. Start-ups e empresas de tecnologia já estão na corrida para criar ferramentas e produtos para torná-las mais acessíveis. 

As técnicas de autossumarização geralmente se encaixam em uma destas duas categorias: extrativa ou abstrativa. Métodos extrativos tentam identificar as frases mais importantes de um documento e depois criar um resumo bem alinhavado. Versões modernas dessa técnica são bastante complexas, mas a ideia original, que Hans Peter Luhn apresentou para a IBM em 1958, dá um sentido para a abordagem. Luhn propôs que as palavras usadas com mais frequência num documento (excluindo palavras muito comuns como “o” e “e”) oferecessem pistas para o assunto do documento. Frases contendo essas palavras comuns são, portanto, mais representativas do documento. Extraindo essas frases e combinando-as num parágrafo, seria possível criar um
texto que se aproximasse de um resumo. (Mesmo ao descrever essa abordagem original, estou exagerando na simplificação. Para saber mais, veja uma excelente história da subárea de sumarização automática, por Kathy McKeown, da Columbia University, e Ani Nenkova, da University of Pennsylvania.)

Resumos abstrativos, por outro lado, tentam articular a informação contida em um ou mais documentos no idioma original escrito pelo algoritmo. Essa abordagem é mais ambiciosa, e até recentemente não funcionava muito bem. Como ilustra o roteiro de Sunspring, é difícil gerar linguagem nova. Mas o progresso do aprendizado profundo — uma subárea do aprendizado de máquina — tem despertado interesse crescente na sumarização abstrativa e produzido resultados promissores. Para ilustrar o que o aprendizado de máquina pode e não pode fazer, vamos comparar um resumo escrito por um editor de nossa área de IA com dois resumos automáticos, um extrativo e outro abstrativo.O primeiro foi escrito por um editor da HBR. Está gramaticalmente correto, descreve os principais pontos do artigo e se reporta na terceira pessoa (“os autores descrevem”). O seg undo resumo é extrativo e foi gerado por um protótipo criado por uma empresa de pesquisa, a Fast Forward Labs. Utilizando artigos reais e resumos de um site de sugestões de leitura, a equipe da Fast Forward treinou uma rede neural para classificar frases conforme a probabilidade de serem incluídas no resumo. As frases com pontuação mais alta, combinadas na ordem em que aparecem no artigo original, transformam-se no resumo. No caso de nosso artigo, a frase com pontuação mais alta do modelo é a inicial, “A tecnologia mais importante com finalidades gerais de nossa era é a inteligência artificial”, que é também, sem dúvida, a tese do artigo. Nesse sentido, quem produziu o resumo extrativo trabalhou bem. Mas quando as sete frases do topo são organizadas em sua ordem original, a primeira frase inclui o pronome “estes” sem menção a que se refere. (É difícil ensinar esses sistemas a reconhecer o substantivo ao qual um pronome se refere, e o protótipo da Fast Forward falhou nisso.)

O terceiro resumo, cortesia de Alexander Rush, professor de engenharia de Harvard, é abstrativo. Rush treinou seu sistema a escrever resumos de três frases sobre artigos da CNN. E embora ele enfatize que não se trata ainda do atual estágio dos resumos abstrativos, ele se propôs fazer uma tentativa com as primeiras 450 palavras de nossa principal atração de IA. “O sistema, teoricamente, é abstrativo”, comenta Rush, “por isso pode gerar qualquer coisa que queira. Na prática, é como se ele estivesse gerando principalmente frases que vê no artigo original.” Em outras palavras, ele evita os resultados sem sentido do Sunspring, mas à custa da originalidade. E da mesma forma que o resumo extrativo, esta captura os temas principais do artigo, mas inclui uma referência à “tecnologia” sem fornecer o contexto necessário.

Esses resumos têm qualidade suficiente para substituir os escritos por seres humanos? Talvez não exatamente. Mas essa não é a pergunta correta. Seria melhor perguntar se os primeiros rascunhos de resumos escritos por IA podem acelerar nosso processo. E nesse caso, a resposta quase certamente é sim.

OIA COMO ASSISTENTE DE PESQUISA
A sumarização pode parecer uma tarefa muito simplificada para fazer uma grande diferença no processo de redação, mas combinada com outras tecnologias relacionadas, ela cria a oportunidade de auxiliar os escritores numa parte crucial de seus processos: pesquisa. E a pesquisa é “a coisa mais difícil para quem escreve”, de acordo com David Hill, editor chefe da Singularity Hub, especializada em publicações de ciência e tecnologia.

“A adaptação aos novos tempos não significa submissão, pelo contrário, é um processo em que descobrimos novas formas de tratar com o diferente e inusitado, encontramos soluções e cO Google, cujos algoritmos de pesquisa se baseiam em IA, já transformou o processo de pesquisa e tornou os escritores significativamente mais produtivos. Mas o Google não é um assistente de pesquisa perfeito. Hill descreve a pesquisa que o Google realiza como “rasa” e “frenética”. “É absurdamente trabalhosa, em qualquer pesquisa que você faça”, observa Susannah Locke, editora da Vox.com. Ela mesma confessou que muitas vezes desejou que existisse uma ferramenta que pudesse fazer esse trabalho por ela. Tim Lee, da Ars Technica, descreve seu processo de leitura “desestruturada”: encontrar dez a 15 artigos sobre o assunto, lê-los e tomar notas. Ele sonha com uma ferramenta que possa encontrar mil páginas sobre um tópico e identificar as dez páginas iniciais.”

A oportunidade imediata não é automatizar completamente o processo de pesquisa, mas torná-lo mais estruturado e eficiente. “Não entendo por que novos sites não permitem que você apenas clique numa palavra e monte uma descrição geral”, comenta Brian Ulicny, cientista de dados da Thomson Reuters Labs. (Esclarecimento: a esposa de Ulicny e eu somos colegas.) Em 2006, enquanto trabalhava na Lycos, Ulicny escreveu um artigo no qual descreve um “motor de fusão de informação”. Digitando uma palavra ou um tópico, como você faz no Google, em vez de apresentar uma lista de links, o sistema organiza parágrafos de conteúdos encontrados na web “num resumo coerente ou num briefing de background”, o que Ulicny chama de “texto no nível do primeiro rascunho de um artigo da Wikipedia”.

Ulicny não é o único a sugerir que a revisão de tópicos ou de notícias pode ser gerada automaticamente por um software. Cientistas da computação vêm criando sistemas e publicando artigos sobre isso há mais de 15 anos. Esses projetos são tecnicamente complexos e variam de formas importantes. Mas eles enfrentam os mesmos desafios e seguem um processo similar.

Hilary Mason, cientista de dados e fundadora da Fast Forward Labs, destaca as principais tarefas que esses sistemas precisam executar: primeiro, identificar a fonte de dados, ou seja, certo número de documentos de texto como artigos em publicações. Depois, identificar a informação mais importante contida nesses documentos e extraí-las. Finalmente, essa informação precisa ser apresentada ao usuário final. Em algum ponto no meio do caminho, muitos desses sistemas executam um quarto passo: tentam identificar alguma estrutura para a história. Trata-se de uma cronologia de eventos independentes? Da biografia de uma pessoa? De parte de uma história maior? Além de ajudar o sistema a decidir qual informação é importante, a estrutura pode fornecer um esboço sobre como apresentá-la ao usuário final. 

Esse processo se assemelha à forma como os humanos abordam, pelo menos, pesquisas simples e tarefas de redação. John O’Neil edita o explicativo QuickTake, da Bloomberg, mas antes disso ele analisa páginas sobre a matéria no New York Times. Ele descreve o processo que ele e sua equipe utilizaram para escrever o texto das páginas sobre a matéria (que desde então já mudaram de formato): primeiro, descubra quatro ou cinco artigos-chave publicados pelo Times sobre o assunto. Segundo, identifique os parágrafos de background de cada história (mesmo contrários às notícias). Terceiro, redija um resumo que combine a informação desses parágrafos de background. Portanto, os passos principais são os mesmos, para os humanos e para o software. 

O FUTURO DA IA E DA REDAÇÃO
Se essas ferramentas já estão por aí há anos, mesmo de forma imperfeita, por que elas não tiveram mais impacto na redação? Um motivo, como acontece com boa parte da tecnologia revolucionária, é a cultura. De um lado, muitos escritores não sentiram necessidade dessas ferramentas. De outro, cientistas da computação nem sempre se preocupam com a forma como as pessoas utilizam o trabalho que eles realizam. De acordo com Ani Nenkova, na autossumarização o foco tem sido principalmente em melhorar a precisão, e não em pensar como a tecnologia poderia ser integrada numa ferramenta que as pessoas pudessem, de fato, utilizar.

Outro motivo é o custo – a maioria dos escritores e salas de redação não dispõe de muitos recursos financeiros. “A maior parte do progresso (no processamento de linguagem natural) ocorre quando analistas de segurança e o governo estão interessados em monitorar notícias do exterior”, observa Nenkova, cujo Ph.D. foi financiado pela Agência Avançada de Pesquisa de Projetos de Defesa dos EUA (Darpa). Finanças também é uma área na qual o aprendizado de máquina e o processamento de linguagem natural produziram impacto, principalmente porque o dinheiro estava disponível para custeá-los.  

O último motivo de essas ferramentas não terem provocado nenhum abalo na redação é simplesmente que os resultados, em si, não foram suficientemente bons para atender satisfatoriamente os leitores de forma consistente. Em seu artigo, Ulicny apresenta à imprensa um informe autogerado sobre o jogador de hóquei aposentado Mario Lemieux. O sistema reconheceu subtópicos importantes que poderiam fazer parte do explicador, como “jogos”, “temporada” e “Pittsburgh Penguins”. Ele também adicionou “gelo” — um tópico que em certo sentido está claramente relacionado, mas que nenhum outro redator teria incluído no perfil de um jogador de hóquei. 

Tudo isso está mudando. A tecnologia está se tornando melhor e mais fácil de usar, e cada vez mais escritores e empresas de mídia reconhecem que softwares inteligentes podem ajudá-los a executar seu trabalho. Está bem claro para mim que o aprendizado de máquina tem um papel de curto prazo em vários tipos de redação, mas, para a maioria, ele não envolverá a produção de artigos completos. Em vez disso ele ajudará os jornalistas a produzir esses artigos com mais eficiência.

Um batalhão de pessoas está desenvolvendo ferramentas para que isso possa se concretizar. David Hill dispõe de verba para criar um assistente de pesquisa de fonte aberta. A start-up Frase, em estágio inicial, em Boston, está trabalhando em algo similar, embora o objetivo de seus fundadores seja ter como clientes iniciais os profissionais de marketing. O Google Docs já dispõe dessa ferramenta, mas sua funcionalidade é limitada.

A Vox criou um Slackbot para mostrar aos redatores artigos antigos que eles podem querer citar em novas histórias. A ferramenta Watson da IBM criou um protótipo chamado Watson Angles que resumia novas histórias, criava linhas do tempo e destacava citações significativas. O protótipo, retirado da web no ano passado, incluía também algumas peças-chave de metadados, como análises de sentimentos de como usuários do Reddit responderam às reportagens em questão, variando de positivo para negativo.

Esses projetos estão apenas começando. Imagine uma reportagem sobre um incêndio em Londres que menciona que a sua amiga que vive lá postou, há uma hora, que ela está bem. Ou um texto que se ajuste automaticamente ao nível do background de conhecimento do leitor. Ou um verificador de fatos embutido num processador de texto. Ou páginas de matéria cobrindo uma longa cauda de assuntos de nichos pelos quais pequenos públicos são apaixonados, mas que poucos editores atualmente têm condições financeiras de produzir. Ou um assistente de pesquisa que mostre histórias relevantes escritas há um século com a mesma rapidez que uma publicada na semana passada.

Os algoritmos ainda não conseguem compor uma narrativa como uma pessoa. Não conseguem escrever um roteiro decente, ou passar no teste de Schank de Romeu e Julieta. Não conseguem raciocinar sobre causa e efeito. Não conseguem escrever prosa empolgante. Não conseguem persuadir um agente público a continuar defendendo uma política importante. No entanto, há muitas coisas que eles podem fazer. A IA pode não ser capaz de contar uma grande história, mas ela pode nos ajudar a contar melhor a nossa.