Em 11 de setembro de 2001, as Torres Gêmeas em Nova York foram atacadas por dois aviões civis sequestrados por terroristas. A esse ocorrido sucederam-se um ataque ao Pentágono e a queda de um avião em direção a Washington, esse como consequência da sua tomada de controle por passageiros em embate com os seus sequestradores.
Todas as pessoas que eram suficientemente conscientes na ocasião lembram-se exatamente o que estavam fazendo quando receberam as notícias daquela tragédia. O que a maioria das pessoas não sabe é que, a aquele ocorrido, sucedeu-se um processo que durou vários anos. Um processo que essencialmente deveria decidir se o que ocorreu naquele dia foi um evento (composto por duas partes) ou dois eventos.
A questão parece absurda e poderia até soar de mau gosto, dado o terror circundante. No entanto, essa era uma questão de enorme importância. Era mais que uma “pergunta de 1 milhão de dólares”. Na verdade, era uma pergunta de 3,5 bilhões de dólares! Isso porque as torres eram asseguradas em 3,5 bilhões de dólares contra qualquer evento destrutivo.
Reflita, caro leitor, por alguns minutos como você defenderia as duas posições?: opção (a): um evento composto por duas partes; opção (b): dois eventos separados.
Aqueles que defendem a opção (b) frequentemente usam argumentos que seguem na seguinte linha: “Eram dois aviões, com diferentes passageiros e terroristas, e atingindo torres diferentes. Além disso, um desses eventos poderia ter acontecido sem que o outro acontecesse”. A essa altura, os defensores da posição (a) contestariam: “Mas esses não foram somente eventos, mas eventos intencionais, ou seja, são ações que seguem um plano. Os dois eventos fazem parte do mesmo plano!”.
Esse episódio aparece no livro "Do que é feito o pensamento" do cientista da cognição Steven Pinker. Pinker enfatiza que as diferentes posições acima se baseiam em diferenças semânticas associadas ao termo evento’. Ele está correto, mas a questão vai além disso e remonta a uma disciplina com origem na filosofia grega antiga mas, como veremos, absolutamente fundamental para o futuro da IA: Ontologia.
Por trás das diferenças semânticas, essas posições refletem diferentes critérios ontológicos de individualização, unidade e identidade daqueles eventos, ou seja, onde é a fronteira do evento, onde ele acaba, quais são suas partes, e como sabemos se tratar ainda do mesmo evento.
Os que defendem (b) usam critérios espaço-temporais e de participação para responder a essas perguntas: dois eventos são iguais se ocupam a mesma região espaço-temporal e têm os mesmos participantes; os defensores de (a), por outro lado, defendem que ações são individualizadas e unificadas por intenções, ou seja, todos os eventos que fazem parte do mesmo plano (manifestando a mesma intenção) são partes de um mesmo todo.
Esse caso ilustra vários aspectos importantes sobre a relação entre ontologia (o estudo do que existe e da natureza intrínseca das coisas), semântica (o que os termos significam) e a veracidade dos dados.
Em primeiro lugar, ele ilustra que fatos não existem prontos na realidade, mas são extraídos (ou recortados) dela seguindo um conjunto de critérios ontológicos – critérios de unidade, identidade e individualização são critérios ontológicos.
Nesse exemplo, a proposição “os donos das Torres Gêmeas têm direito a 7 bilhões de dólares de indenização” é verdadeira ou falsa dependendo de como os fatos subjacentes são recortados e por quais critérios ontológicos. Em outras palavras, se algo é fato ou “fake” também depende desses critérios.
Além disso, ele nos mostra que podemos recortar a realidade de maneiras diferentes, mas temos que viver com as consequências dos critérios de recorte que escolhemos. Por exemplo, se adotarmos os critérios em (a), teremos como consequência que os ataques realizados no Pentágono e a queda do avião em direção a Washington são partes do mesmo único evento complexo, como partes desconexas e substancialmente distantes espacialmente.
Por fim, o exemplo deixa claro que a veracidade da proposição acima não pode ser resolvida empiricamente, ou seja, colhendo mais dados sobre a questão. Ela só pode ser decidida raciocinando com critérios ontológicos previamente acordados.
Poderíamos preencher um livro somente com exemplos desse tipo. Eles estão por toda parte. Isso porque usamos categorias ontológicas (ex.: objetos e eventos, suas partes, seus tipos, suas propriedades, as relações em que estão envolvidos - como a participação de objetos em eventos ou relações de causalidade entre eventos) para estruturar todos os nossos modelos mentais sobre a realidade, ou seja, alguns dos nossos mais importantes modelos de mundo.
Como discuti na coluna passada, pensamos também com os nossos corpos e as nossas emoções e, por isso, algumas “representações” que temos
do mundo externo estão impressas neles.
Um mundo de ficções
No entanto, vivemos grande parte das nossas vidas em um mundo que não é físico, mas social (incluindo cultural e legal). Um mundo de entidades criadas pela nossa intencionalidade coletiva (ex.: países, cidadanias, casamentos, diplomas universitários, títulos de posse, dinheiro).
Em certo sentido, um mundo de ficções, e, quanto mais nos distanciamos do mundo físico e adentramos esse mundo de construção social, mais precisamos fazê-lo sobre fundamentos sólidos que capturem o significado dos dados no mundo e não somente aspectos sintáticos da linguagem.
Ignorar essas questões na criação de sistemas artificiais nos traz (e trará cada vez mais) problemas. Para citar um exemplo, em um episódio recente, um sistema de IA usado para automatizar a confecção de relatórios policiais reportou que um policial do estado de Utah nos EUA tinha se transformado em um sapo!
Como explicar o mistério? O sistema de IA, que era acoplado à câmera corporal do policial, havia acidentalmente começado a seguir os sons de um filme passando no fundo. O filme era “A Princesa e o Sapo”, dos estúdios Disney.
Esse problema poderia ter sido evitado facilmente se o sistema tivesse representado e raciocinado com regras ontológicas muito básicas: (1) policial é um papel desempenhado por pessoas, ou seja, todo policial é uma pessoa; (2) pessoa e sapo são dois tipos necessariamente disjuntos de coisas, ou seja, nada pode ser ao mesmo tempo um e outro e nenhuma pessoa pode se transformar em sapo ou vice-versa.
Wikimedia Commons
Esse exemplo demonstra a ligação estreita entre aspectos ontológicos e de senso comum. Essa relação é essencial. Entendemos o mundo através das lentes de um modelo ontológico (um grande modelo de mundo) subjacente à nossa cognição.
Além disso, todo raciocínio sobre o senso comum tem em sua base esse tipo de raciocínio ontológico. E isso tem um papel tão central em nossa cognição que realizamos esse tipo de raciocínio o tempo todo e sem nos darmos conta que o fazemos.
Deixe-me ilustrar esses pontos com uma pequena história. Suponha que Ana encontre João na escola e, enquanto conversam, Ana repare e fique impressionada com o relógio que João está usando. Ela pensa que aquele seria um presente interessante para o seu pai, cujo aniversário se aproximava.
Interrompidos, ela perde a oportunidade de perguntar-lhe a respeito. No dia seguinte, Ana encontra João na praia. João está sem o relógio. Surpresa, ela pergunta sobre o paradeiro do relógio. Demonstrando visível tristeza, João responde: “Eu o tinha guardado dentro do meu estojo, que estava dentro da minha mochila. Eu não o tinha colocado no meu bolso porque ele era muito pequeno. Estava caminhando em frente à escola quando passou de bicicleta uma mulher e levou minha mochila. Ela desapareceu antes que eu pudesse reagir”.
Triste história. No entanto, tenho certeza de que o leitor entendeu exatamente o que aconteceu com o relógio. No entanto, se ele retornar e reler o texto, perceberá que João não diz em momento algum o que aconteceu com o relógio! Para entender o exemplo, você leitor, usa sem perceber um conjunto de teorias de senso comum:
que se um objeto está dentro de uma superfície fechada (o estojo) que está dentro de outra superfície fechada (a mochila), tudo que está dentro da primeira está dentro da segunda e, se alguém transportar a segunda, transporta também tudo que está dentro dela e que isso inclui tudo que está dentro de tudo que está dentro dela, transitivamente;
você também raciocina sobre as intenções da mulher na bicicleta, porque ela levou a mochila, que ela não tinha autorização para levar a mochila, porque ela não vai devolver a mochila, as implicações legais disso etc.;
também raciocina sobre o valor (financeiro, sentimental) do relógio e a persistência e estabilidade da sua relação com seu dono. Por exemplo, se durante a primeira conversa João estivesse segurando um guardanapo, Ana não lhe perguntaria sobre o seu paradeiro no dia seguinte.
Todos nós realizamos esse raciocínio sofisticado, convergindo às mesmas conclusões, de forma correta, consistente, inconsciente, e tudo isso em uma fração de segundo!
Deixe-me apontar outro ponto na história acima que frequentemente passa despercebido da maioria dos leitores. Na frase: “Eu não o tinha colocado no meu bolso porque ele era muito grande”, a que o pronome ‘ele’ se refere aqui? Ao relógio? Ao bolso? Analogamente, no trecho: “Estava caminhando em frente à escola quando passou de bicicleta uma mulher e levou minha mochila. Ela desapareceu antes que eu pudesse reagir.” O que desapareceu antes que ele pudesse reagir? A mulher? A mochila? A escola?
Para todos nós a resposta é óbvia, mas não pelo que está contido no texto, e sim pelo que está por trás do texto. Pela semântica do texto e a ontologia por trás dele: escolas podem até desaparecer, mas geralmente não tão rápido; mochilas podem desaparecer rápido, mas reagir aqui é agir contra uma ação intencional, ou seja, a resposta para cada um de nós é obviamente ‘a mulher’.
Do mesmo modo, no exemplo anterior sabemos que a referência é ao relógio porque temos uma teoria de senso comum nos dizendo que objetos maiores não cabem em espaços menores.
Para deixar isso ainda mais claro, na frase “Eu não o tinha colocado no meu bolso porque ele era muito pequeno”, que é gramaticalmente idêntica à anterior, agora o pronome magicamente se refere ao bolso e não mais ao relógio. A explicação é a mesma regra de senso comum.
Do ponto de vista da construção de sistemas de IA, fica cada vez mais claro que precisaremos representar e raciocinar sobre o senso comum. Precisamos desenvolver versões computacionais desses modelos ontológicos. A contribuição desses modelos, no entanto, vai além da sua contribuição para um “senso comum” computacional. Eles são fundamentais para:
garantir a qualidade, incluindo a veracidade, dos dados com os quais sistemas de aprendizagem de máquina são treinados;
integrar dados oriundos de diversas fontes – afinal, para sabermos como integrar dados, precisamos entender as conexões entre as coisas no mundo que eles representam;
prover explicações sobre decisões feitas por esses sistemas, afinal explicar é revelar uma certa estrutura de mundo. Por exemplo, explicar por que alguns genes podem causar uma doença é revelar todo um mecanismo causal conectando entidades biológicas (esses genes, eventos que os envolvem) com aquele tipo de doença;
dar suporte à estabilidade de raciocínio (ex.: se o sistema "acredita" em uma coisa, continua a fazê-lo até que algo aconteça no mundo e mude essa sua "cresça") e ao raciocínio contextualizado (ex.: sabemos que em “A Princesa e o Sapo” pessoas podem se transformar em sapos, mas nunca misturamos isso com o mundo real);
por fim, esses modelos são essenciais para que sistemas possam raciocinar extrapolando os dados aos quais foram expostos – em situações inéditas, raciocinar abstraindo a teorias básicas e por analogia (ex.: ao encontrarmos pela primeira vez em nosso caminho uma nave espacial, raciocinamos com uma teoria de senso comum sobre objetos físicos sólidos que nos informa que não podemos atravessá-los sem consequências, bem como suas condições de permanência etc.).
Nas últimas quatro décadas, alguns poucos grupos de pesquisa no mundo trabalhavam na construção de teorias ontológicas computacionais que capturassem esses aspectos do senso comum para que possamos habilitar máquinas a raciocinar com essas noções.
Eu estive liderando desde o início a construção de uma delas, chamada UFO (Unified Foundational Ontology), ou Ontologia de Fundamentação Unificada. UFO é uma teoria construída na Holanda, Itália e Brasil, mas seus principais arquitetos são, além de mim, quatro outros brasileiros, sendo três deles os capixabas João Paulo Andrade Almeida (professor da Universidade Federal do Espírito Santo), Tiago Prince Sales e Claudenir Morais Fonseca (ambos da Universidade de Twente, na Holanda), além de um carioca com coração capixaba, Ricardo Falbo (in memoriam), que também foi professor da Universidade Federal do Espírito Santo.
Refletindo a importância de teorias desse tipo, e dessa em particular, a organização internacional de padronização ISO a está reconhecendo como o padrão ISO/IEC 21838-52 (https://www.iso.org/standard/89915.html). Um padrão de referência internacional com DNA brasileiro (e capixaba!). Uma teoria usada no mundo inteiro e que despertou interesse até da Nasa.
UFO é um modelo simbólico (um modelo formal computacional) explicando para uma máquina parte do senso comum através de formalização e mecanização de regras lógicas dos mais diversos tipos. No entanto, em seu coração, temos uma teoria filosófica formulada por Aristóteles ainda na Grécia antiga e versando sobre relações, eventos, causalidade, objetos, identidade etc.
Como mencionei anteriormente, se ignorarmos esses modelos, podemos ter consequências catastróficas no uso de IA em contextos críticos. O erro no relatório do policial foi facilmente detectado (pelo uso do senso comum humano!).
No entanto, imagine quando os resultados produzidos por sistemas de IA forem sobre química fina, sobre medicina, operações espaciais e de defesa, sobre direito, finanças, ou quando grande parte do software do mundo, do qual cada vez mais dependemos, for feito por máquinas, e máquinas incapazes de explicar o seu processo de raciocínio, extrapolar os dados a que foram expostas, julgar a veracidade das informações que manipulam, ou até mesmo a plausibilidade e relevância delas (o que é sinal e o que é ruído).
A solução para todos esses problemas não está nos dados, mas além deles. Não está nas formas sintáticas, mas em sua semântica, e semântica é o mapeamento de símbolos (dados) em nossos modelos sobre o mundo. Por fim, a construção desses modelos deverá ser necessariamente guiada por princípios ontológicos. Precisamos de uma metafísica computacional.
Raciocinar no mundo real requer que sejamos capazes de resolver vários problemas ligados à inteligência e cognição artificial - alguns dos quais não sabemos como resolver (veja). De todo modo, estou absolutamente convencido que parte do caminho para o futuro da IA depende de sermos capazes de ensinar teorias aristotélicas de 2.300 anos de idade a uma máquina.