Seminários 2006 2005 2004 2003 2002 2001

Localização de Markov para Multirrobôs Cooperativos

Palestrante: Valguima Odakura (doutoranda LTI)

Data: 07/12/2006 10:00h

Local: Prédio da Engenharia Elétrica da POLI/USP, sala C1-49

Resumo: Esta tese propõe um modelo probabilístico geral para a localização cooperativa de multirrobôs. O problema da localização multirrobôs pode ser definido como: dado um modelo do ambiente, estimar a localização de cada robô em um grupo atuando em um mesmo ambiente, com base nas informações sensoriais oferecidas pelas medidas de odometria, medidas do ambiente e detecções. Detecção é a habilidade de um robô identificar outro e determinar a distância relativa entre eles. A idéia principal da localização cooperativa de multirrobôs consiste em integrar medidas coletadas por diferentes robôs, de modo que todos possam se beneficiar dos dados adquiridos pelos outros robôs do grupo. Desta forma, detecções podem ser usadas para refinar a crença de postura de cada robô com base nas estimativas dos outros. Comunicação fornece aos robôs a habilidade de compartilhar entre eles suas crenças de postura de forma que possam cooperar para melhorar a acurácia da localização. Aqui é explorado o uso de diferentes tipos de informação para comunicar entre os robôs: propagação da detecção positiva, detecção negativa e multidetecção, os quais são integrados em um novo algoritmo, chamado Localização de Markov para Multirrobôs Cooperativos (LMMC). Também é proposto um protocolo de comunicação para a troca de dados entre os robôs e um conjunto de critérios que possibilitam a redução da comunicação por meio da diminuição da quantidade de dados trocados entre robôs, de um modo eficaz e eficiente. Os experimentos realizados em ambientes simulados demonstram que a abordagem proposta pode conduzir a resultados significativamente melhores de localização quando comparada à abordagem com detecção única e ainda com uma menor quantidade de mensagens trocadas entre os robôs.

 

Extração de Preferências por meio de Avaliações de Comportamentos Observados no Aprendizado por Reforço

Palestrante: Valdinei Freire da Silva (doutorando LTI)
Data: 01/12/2006 11:00h
Local: Prédio da Engenharia Elétrica da POLI/USP, sala C1-49

Resumo: Aprendizado por Reforço é um método que ajuda a programar um agente autônomo descrevendo objetivos através de reforços, sendo o agente responsável por descobrir as melhores ações para atingir estes objetivos. O agente determina tais ações por meio de iterações do tipo tentativa e erro em um ambiente não determinista, construindo assim uma política de ação ótima. Tal política maximiza a esperança de reforços acumulados. No entanto, não é trivial a descrição de objetivos em reforços. Extração de Preferências é um método, normalmente aplicado a seres humanos, que auxilia na descrição de objetivos em um formato computacional, para que um agente possa participar nas tomadas de decisões em nome de um indivíduo. Um objetivo pode ser descrito computacionalmente por uma função utilidade, da qual os reforços são uma especialização, e é suposta ser uma eficaz abstração dos objetivos sendo independente do ambiente. A Extração de Preferências é feita através de perguntas hipotéticas a um avaliador, cujas respostas restringem as funções utilidades possíveis. Essa tese pretende introduzir o tema de Extração de Preferências no Aprendizado por Reforço, considerando um ambiente com um avaliador que emite avaliações de comportamentos demonstrados por um agente. Essas avaliações podem ser absolutas, relativas e estatísticas. A diferença com relação aos métodos tradicionais de Extração de Preferências é que as perguntas (comportamentos) são agora limitadas pela dinâmica do ambiente e pelo acesso que o avaliador tem do mesmo. Dessa forma, pretende-se estudar três problemas principais originados dessa diferença: 1) a diferença entre o agente e o avaliador com relação a observabilidade do ambiente e seus efeitos; 2) a limitação com relação as perguntas que podem ser realizadas devido a dinâmica do ambiente e seus efeitos na função utilidade obtida, principalmente quando esta é transferida para um segundo ambiente; e 3) a política que o agente deve executar em um ambiente não determinista para obter comportamentos que resultam em avaliações informativas.

 

Towards cooperation among competitive trader agents
Palestrante: Paulo André Castro (doutorando LTI e professor ITA)
Data: 23/11/2006 10:00h
Local: Prédio da Engenharia Elétrica da POLI/USP, sala C1-49

Resumo: In order to manage their portfolios, human traders in stock markets use a set of algorithms created by economists, based on stock´s prices series,  to determine buy and sell signals.  These algorithms are usually referred as technical analysis.   However, traders prefer to use several algorithms as indicators, rather than choosing a single algorithm.  The several signals provided (and many times fundamental signals, experience trader) are used to determine the trader order or to decide not to submit any order.  Some work tries to create new algorithm with learning skills in order to trade in autonomous way, by creating better algorithms using AI techniques. Inspired by traders decision processes, our approach tries to compose heterogeneous autonomous trader agents in competitive multiagent system. This architecture allows the use of several algorithms based on different technical analysis indexes to manage portfolios. We have implemented this architecture and have performed a set of simulation experiments using real-data. The system´s results were compared to the performance of  agents laying alone. Our results show better performance when traders compete with each other for resources. These results indicate that competition among agents, as proposed, may reach very good results, even among agents created to act alone in this kind of market.

 

Agent-based participatory simulations: Participatory design of multi-agent systems and hybrid systems
Palestrante: Paul Guyot (LIP 6 - Paris - France)
Data: 17/11/2006 11:30h
Local: Prédio da Engenharia Elétrica da POLI/USP, sala C1-49

Resumo: Agent-based participatory simulations are laboratory experiments where human participants access an agent-based simulation the same way agents do. Participants are seated at a computer and all interactions are recorded. Inspired from the companion modeling tradition, experimental economics and ethnomethodological breaching, they can be used to explore, model and reproduce mechanisms of collective behaviors within multi-agent systems. The method was applied to conduct twenty experiments for three different domains: coalition formation, collective management of renewable resources and game theory. It was applied to favor the emergence and the understanding of improved agent-based distributed solutions. Experiments also revealed that many aspects of standard agent-based interactions and protocols are inadequate to model the interactions between agents controlled by humans, or, in other words, human participants understood as autonomous software agents. Consequently, these standard protocols could not be used to build hybrid systems involving both humans and agents, where several humans and several agents should cooperate together to resolve problems and execute tasks. To design agents for hybrid multi-agent systems (featuring humans and agents), agents must be tolerated by humans and consequently must implement interaction behaviors that are closer to human collective behaviors. Recent experiments showed that agent-based participatory simulations, because they can be used to understand the individual strategies of participants, can serve to design hybrid systems where humans and agents form heterogeneous and homogeneous coalitions.

 

Multidetection In Multirobot Cooperative Localization
Palestrante: Valguima Victoria Viana Aguiar Odakura
Data: 29/09/2006 14:00h
Local: Prédio da Engenharia Elétrica da POLI/USP, sala B2-09

Resumo: This paper describes a new technique to cooperative multirobot localization based on multidetection. In conventional multirobot localization, the poses beliefs of two robots are updated whenever one robot detects another one and measures their relative distance. When a group of robots localize themselves in the same environment, it may happen that one robot detects more than one robot at once or that one robot sees other robot that sees another one - both cases depict a multidetection situation. We propose a communication structure to incorporate the multidetection information in the pose belief. The key idea is that robots more certain about their poses have more useful information to share with other robots, so they should communicate first, propagating their knowledge to the rest of the group. The technique has been implemented and tested in simulated environments. Experiments show significant improvements in localization accuracy when compared with the conventional multirobot localization.



Rastreamento Simultâneo de Múltiplos Alvos em Seqüências de Imagens
Palestrante: Rodrigo Andrade de Bem
Data: 21/09/2006 14:00h
Local: Prédio da Engenharia Elétrica da POLI/USP, sala C1-49

Resumo: Será apresentada a proposta de um abordagem para execução do rastreamento visual de múltiplos alvos observados simultaneamente em seqüências de imagens. O objetivo principal é o desenvolvimento de uma metodologia capaz de realizar o rastreamento visual de alvos heterogêneos, usando pouca informação a priori sobre os mesmos. Ainda assim a abordagem deverá solucionar de modo eficiente alguns problemas importantes, como a oclusão e identificação única de cada alvo.

 

Rastreamento Visual de Múltiplos Objetos Utilizando uma Abordagem Livre de Modelo.
Palestrante: Rodrigo Andrade de Bem
Data:01/09/2006 12:00h
Local: EPUSP - Sala C1-49 - Prédio da Engenharia Elétrica

Resumo: Será apresentada uma metodologia para o rastreamento visual de múltiplos objetos móveis que se movimentam limitados por um plano (por exemplo, o chão), sem oclusões, em seqüências de imagens capturadas poruma camera estática. A abordagem empregada descreve os alvos através de seus contornos, mas sem a determinação a priori de sua forma. Ao invés disso, os contornos são estabelecidos dinamicamente, o que caracteriza uma vantagem desse tipo de abordagem, pois possibilita o rastreamento simultâneo, e sem a necessidade de alterações no modelo, de objetos com formas diferentes como, por exemplo, pessoas e robôs móveis que circulam em um mesmo ambiente, ou ainda vários robôs heterogêneos.

 

Localização de dispositivos móveis em redes Wi-Fi com aprendizagem em tempo de execução
Palestrante: André Iasi Moura
Data: 01/09/2006 11:40h
Local: EPUSP - Sala C1-49 - Prédio da Engenharia Elétrica

Resumo: Com o aumento da utilização de dispositivos móveis, uma série de aplicativos que necessitam de um sistema que estime a localização de tais dispositivos de uma forma eficiente e confiável vem sendo desenvolvida. Um dos desafios no desenvolvimento de sistemas de localização é apresentar bons resultados em ambientes fechados como prédios e casas, e o uso dos sinais das redes Wi-Fi tem sido uma solução bastante empregada. Este trabalho propõe um sistema de localização em redes Wi-Fi que usa um modelo oculto de Markov (Hidden Markov Model) e um algoritmo que dinamicamente aprende probabilidades de transição entre estados com base nos caminhos que os dispositivos fazem no ambiente. O sistema presentado mostra alguns resultados incentivadores quando comparados àqueles de um sistema com probabilidades de transição fixas.

 

Adaptação de funções utilidades para aprendizado por reforço
Palestrante: Valdinei Freire da Silva
Data: 01/09/2006 11:20h
Local: EPUSP - Sala C1-49 - Prédio da Engenharia Elétrica

Resumo: Aprendizado por Reforço é um método que permite programar um agente autônomo com uma função utilidade, sendo o agente responsável por encontrar a política ótima para satisfazer tal função. No entanto, as funções utilidades devem ser representadas de forma adequada como funções reforços, nas quais o funcionamento dos principais métodos de aprendizado por reforço baseiam-se. Este artigo propõe um algoritmo, MSE-RL, que faz de forma automática a transposição de uma dada função utilidade para uma função reforço utilizando regressão linear. Tal algoritmo permite a aplicação de métodos tradicionais de aprendizado por reforço a funções utilidades genéricas, contudo, sem garantir um ótimo desempenho.

 

Relaxação do Modelo Oculto de Markov para o Problema de Mapeamento e Localização Simultâneos
Palestrante: Antonio Henrique Selvatici
Data: 01/09/2006 11:00h

Local: EPUSP - Sala C1-49 - Prédio da Engenharia Elétrica

Resumo: Dotar um robô móvel da capacidade de mapear um ambiente desconhecido ao mesmo tempo que determina sua localização é um problema de difícil solução. Este trabalho apresenta uma nova modelagem para esse problema, tratando-o como um processo a estados discretos regido por uma relaxação da condição de Markov. A modelagem requer que o robô distingua a presença de marcos no ambiente, sem no entanto ser necessário que os marcos sejam distinguíveis entre si.
Para a resolução do problema de mapeamento e localização simultâneos, é utilizado um algoritmo de busca informada com a adoção de uma heurística admissível. Os resultados indicam que a abordagem é apropriada, mas a heurística utilizada não é suficientemente eficiente de forma a permitir um rápido processamento de um conjunto grande de dados.

 

"Self-configuration in Autonomic Electronic Institutions"

Palestrante: Eva Bou

Data: 11/08/2006 - 14:00h

Local: EPUSP - Sala B2-04 - Prédio da Engenharia Elétrica

Resumo: Electronic institutions (EIs) have been proposed as a means of regulating open agent societies. EIs define the rules of the game in agent societies by fixing what agents are permitted and forbidden to do and under what circumstances. And yet, there is the need for EIs to adapt their regulations to comply with their goals despite coping with varying populations of self-interested external agents. We focus on the extension of EIs with autonomic capabilities to allow them to yield a dynamical answer to changing circumstances through norm adaptation and changes in institutional agents.

 

Que Viva a Inteligência, 50 anos de IA
Palestrante: Helder Coelho
Data: 19/05/2006 – 14:30
Local: EPUSP - Sala C1-49 - Prédio da Engenharia Elétrica

Resumo: A Inteligência Artificial (IA) comemora, em Agosto de 2006 (Dartmouth Summer Workshop), 50 anos. A longa marcha desde Alan Turing, e da sua ideia de olhar para o comportamento para entender a natureza da inteligência, adoptada depois pelas escolas simbólica, conexionista e robótica, é hoje posta em causa. As sugestões de Cristiano Castelfranchi para olharmos para a antecipação (previsão), ao desenharmos agentes que possam vencer as surpresas, indicam qual deve ser o futuro das nossas próximas pesquisas. O mapa das suas trilhas está visível nos êxitos e fracassos, nas rupturas e saltos em frente, e também na concorrência de múltiplas escolas que apesar das suas diferenças souberam socializar. Nesta palestra procura-se através de vários sinais (Apostas de 1959 e 1970, Prémios DARPA e Loebner), e de marcas deixadas ao acaso (a guerra às Redes Neuronais), indagar o nexo das viagens de exploração e o porquê das opções adoptadas. Olhando para as Conferências míticas (IJCAI, ECAI) descobre-se o reforço das aprendizagens e as escolhas mais recentes: a constituição do território da IA. Nas disputas (Dreyfus, Searl, Penrose, Hawkins) observa-se a força das controvérsias, através de argumentos que nos ajudaram a compreender melhor a natureza das diferenças, e sobretudo os progressos do nosso conhecimento sobre o cérebro e a mente em geral. As Ciências do Cérebro, as Neurociências e as Ciências da Cognição (tema forte do próximo Programa Quadro 7 da CEE) ampliaram o seu saber e permitem que através de próteses se ajudem deficientes e se fale de cyborgs. A interdisciplinaridade é hoje um dos grandes argumentos para valorizar o empreendimento da IA: a consiliência disciplinar do Edward O. Wilson (sonho do iluminismo) é hoje possível, e o salto entre disciplinas (entre Biologia Molecular e Informática) faz-se na IA com grande facilidade e elegância. Finalmente, no mundo das aplicações, a ideia de agentes com corpo adquiriu uma nova força, popularizando de novo a robótica e dando a mão às necessidades mais urgentes do sector da saúde, consubstanciando o velho sonho dos pioneiros de ser possível pensar em sistemas gerais, integrados e universais.

 

Aprendizado por Reforço Inverso com Avaliação
Palestrante: Valdinei Freire da Silva
Data: 28/04/2006 – 14:30
Local: EPUSP - Sala C1-49 - Prédio da Engenharia Elétrica

Resumo: Aprendizado por Reforço é um método que permite programar um agente autônomo utilizando descrição de objetivos relacionada com a descrição utilizada por seres humanos, sendo o agente responsável por descobrir as melhores ações para atender tais objetivos. No entanto, não é fácil transformar objetivos humanos em reforços. O aprendizado por reforço inverso com avaliação (ARIA) consiste no problema de definir uma função reforço quando o agente recebe avaliações globais sobre comportamentos exibidos por ele mesmo, sejam as avaliações quantitativas ou qualitativas. Nesta apresentação será estabelecida uma relação entre teoria da utilidade,  aprendizado por reforço, e ARIA. Finalmente, algoritmos para ARIA considerando diferentes tipos de avaliação serão apresentados.

 

Uma ontologia organizacional para interoperabilidade em sistemas multi-agentes abertos
Palestrante: Luciano Reis Coutinho
Data: 24/03/2006 – 11:00
Local: EPUSP - Sala C1-49 - Prédio da Engenharia Elétrica

Resumo: Esta tese propõe a criação de uma ontologia organizacional integrada para prover interoperabilidade organizacional envolvendo agentes externos e sistemas multi-agentes (SMAs) abertos centrados na organização. A ontologia organizacional integrada será criada tendo-se por base modelos organizacionais já propostos para SMAs. Utilizando-se a ontologia organizacional integrada, pretende-se prover interoperabilidade organizacional de duas formas. Primeiro, estabelecendo-se mecanismos de tradução entre modelos organizacionais que possam ser implementados em uma camada intermediária de software. Assim, a idéia é fornecer a um agente externo que “entende” determinado modelo organizacional, e que deseja entrar em um SMA aberto que utiliza um modelo organizacional diferente, um serviço de tradução entre o modelo organizacional que o agente “entende” e o modelo organizacional que o SMA utiliza. A segunda forma é prover interoperabilidade organizacional criando um agente que utilize a ontologia organizacional integrada como modelo organizacional interno. Assim, raciocinando de uma maneira global e tendo meios de traduzir seu raciocínio para modelos organizacionais específicos, um tal agente pode migrar entre SMAs heterogêneos quanto ao modelo organizacional subjacente.

 

Simulação de Tráfego Urbano por Sistemas Multiagentes
Palestrante: Inácio Guerberoff
Data: 24/03/2006 – 15:00
Local: EPUSP - Sala C1-49 - Prédio da Engenharia Elétrica

Resumo: A utilização de Sistemas Multiagentes para modelagem microscópica de tráfego é bastante promissora, devido à forte adequação do conceito de agente para representação do elemento básico do modelo: o motorista em um veículo. Neste seminário serão apresentadas algumas abordagens presentemente utilizadas para esse fim, alguns dos problemas e desafios da área, e algumas idéias de trabalhos a serem desenvolvidos.

 

Aprendizado não-supervisionado em redes neurais pulsadas de base radial.
Palestrante: Alexandre da Silva Simões
Data: 17/03/2006 – 11:00h
Local: EPUSP - Sala C1-49 - Prédio da Engenharia Elétrica

Resumo: Redes neurais pulsadas - redes que utilizam uma codificação temporal da informação - têm despontado como uma nova e promissora abordagem dentro do paradigma conexionista emergente da ciência cognitiva. Um desses novos modelos é a rede neural pulsada de base radial, capaz de armazenar informação nos tempos de atraso axionais dos neurônios e que comporta algoritmos explícitos de treinamento. A recente proposição de uma sistemática para a codificação temporal dos dados de entrada utilizando campos receptivos gaussianos tem apresentado interessantes resultados na tarefa do agrupamento de dados (clustering). Este trabalho propõe uma função para o aprendizado não supervisionado dessa rede, com o objetivo de simplificar a sistemática de calibração de alguns dos seus parâmetros-chave, aprimorando a convergência da RNP no aprendizado baseado em instâncias. O desempenho desse modelo é avaliado na tarefa da classificação de pixels em imagens coloridas no domínio da visão computacional.


Reputation model for communication control in multi-agent systems
Palestrante: Laurent Vercouter  (Ecole de Mines de Saint Etienne)
Data: 16/03/2006 – 14:00
Local: EPUSP - Sala C1-49 - Prédio da Engenharia Elétrica

Resumo: Multi-agent systems are software systems considered as open in the sense that agents can dynamically enter or leave the system. This property is interesting to build flexible systems but it also brings some risks as it facilitates the intrusion of malicious agents. To protect a system from such intrusions, some works propose to introduce the concept of reputation to evaluate the honesty of agents and to exclude malicious agents. In this talk, we will present the works done in the Multi-Agent System Dpt of the Ecole des Mines de Saint-Etienne, France in the field of multi-agent reputation. Our works focus on the control of agent communications by the way of reputation. We will present how the communications are represented, how incorrect communications are detected and sanctionned and how a reputation model is built from these detections. In a second part of the talk, we will present the ART (Agent Reputation Testbed) group that aims at providing standard tools for the experimentation and comparison of reputation models.

 

LOCADIO, um sistema para inferir movimento e localização a partir da potência de sinal de redes Wi-Fi

Palestrante: André Iasi Moura

Data: 17/02/2006 11:00

Local: EPUSP, Prédio da Eng. Elétrica, Sala C1-49

Resumo Com a mobilidade e a pervasividade que apresentam os dispositivos eletrônicos hoje em dia, a computação orientada a contexto vem sendo o foco de uma grande quantidade de pesquisas e o sistema de localização em dispositivos portáteis é uma parte importante desse estudo. O maior desafio em localização tem sido obter bons resultados dentro de ambientes fechados e a solução que tem sido escolhida em grande parte dos casos é fazer uso das infra-estruturas instaladas de redes Wi-Fi, analisando potência de sinais de diferentes pontos de acesso para determinar o posicionamento dos dispositivos móveis. Neste seminário será apresentado um sistema chamado LOCADIO, que balanceia a imprecisão causada pelo ruído na medida da potência de sinal com suposições a priori sobre o comportamento do usuário. Essas suposições se baseam primeiro no estado de movimento - parado ou não - do usuário e em seguida em probabilidades de transição - de uma posição previamente estimada para outra - que levam em consideração, além do próprio estado do usuário, estatísticas de velocidades de pedestres e um mapa topológico do ambiente.

 

Copyright © Escola Politécnica da Universidade de São Paulo
Todos os direitos reservados