IBM WebSphere Portal 8.5: Assistência ao utilizador para administradores

Sugestões e recomendações para sequências de hiperligações da Procura do portal

Consulte algumas sugestões úteis sobre sequências de hiperligações da Procura do portal. Por exemplo, a sequência de hiperligações pode exigir mais memória e tempo, consoante o ambiente e a configuração da Procura do portal.

A ferramenta de sequências de hiperligações HTTP não suporta JavaScript

A ferramenta de sequências de hiperligações de HTTP do Serviço de procura do portal não suporta JavaScript. Assim, algum texto de documentos da Web pode não estar acessível para procura pelos utilizadores. A acessibilidade depende do modo como o texto é preparado para ser apresentado no navegador. Especificamente, o texto gerado por JavaScript poderá ou não estar disponível para procura.

A sequência de hiperligações de um sítio do portal pela primeira vez pode dar origem à apresentação de uma mensagem

Ao iniciar uma sequência de hiperligações num sítio do portal pela primeira vez, poderá ser apresentada a seguinte mensagem:
     EJPJP0009E: Wrong root url for Portal site crawler: https://root_url
Pode ignorar esta mensagem. A sequência de hiperligações será executada correctamente.

Para resolver este problema, edite a origem de conteúdo, seleccione o separador Parâmetros gerais e defina o parâmetro Parar a obtenção de documentos após (segundos): como um valor de 90 segundos.

Memória necessária para sequências de hiperligações

Consoante o ambiente da Procura do portal, a sequência de hiperligações pode requerer grandes quantidades de memória. Assim, antes de iniciar uma sequência de hiperligações, certifique-se de que o WebSphere Portal tem memória disponível suficiente. A falta de memória pode originar um conjunto de procura com erros e até mesmo um bloqueio do sistema.

Para resolver este problema, aumente o limite de ficheiros abertos utilizando o comando ulimit como administrador raiz.

Devido aos recursos necessários para uma sequência de hiperligações e indexação, é útil agendar as sequências de hiperligações para que ocorram quando a actividade do utilizador é relativamente baixa.

Tempo necessário para sequências de hiperligações, importações e disponibilidade dos documentos

As seguintes tarefas de administração de procura podem necessitar de períodos de tempo mais alargados:

  • Criar sequências de hiperligações de uma origem de conteúdo. Os documentos poderão não se encontrar imediatamente disponíveis para efectuar procuras ou pesquisas durante a sequência de hiperligações.
  • Indexar os documentos obtidos através de uma sequência de hiperligações. Quando uma sequência de hiperligações estiver concluída e todos os documentos tiverem sido recolhidos, a construção do índice será mais demorada.
  • Importar um conjunto de procura. Ao importar dados para um conjunto, é possível que demore algum tempo até que as origens de conteúdo para o conjunto sejam apresentadas em Origens do conteúdo na caixa Conjunto e os documentos do conjunto importado estejam disponíveis para sequências de hiperligações.

Estas tarefas são colocadas em fila de espera. Assim, poderá demorar alguns minutos até que seja executada e o temporizador inicie. Por exemplo, a sequência de hiperligações Tempo de execução e o tempo de espera para a sequência de hiperligações definido pela opção Interromper recolha após (minutos): O tempo necessário para estas tarefas é influenciado pelos seguintes factores:

  • O número de documentos na origem de conteúdo que se encontra a ser incluído na sequência de hiperligações
  • O tamanho dos documentos na origem de conteúdo que está a ser incluída na sequência de hiperligações
  • Velocidade e disponibilidade dos processadores, sistemas de armazenamento em unidades de disco rígido e ligações de rede.
  • O valor seleccionado a partir do menu pendente Interromper recolha após (minutos): na altura da criação ou modificação da origem de conteúdo.

Deste modo, tanto os limites de tempo especificados pelo utilizador como os tempos indicados para estes processos funcionam como um limite de tempo aproximado. Por exemplo, estes limites de tempo aplicam-se aos seguintes cenários:

  • Quando uma sequência de hiperligações é iniciada através da selecção de uma origem de conteúdo na caixa Origens de conteúdo no conjunto e quando faz clique em Iniciar recolha.
  • Quando é importado um conjunto de procura e quando é iniciada uma sequência de hiperligações no conjunto de procura importado.
  • Quando uma instalação é concluída e o conjunto do sítio do portal pré-configurado é iniciada através da selecção da origem de conteúdo do portal e fazendo clique em Iniciar recolha.
  • A hora apresentada em Última actualização concluída nas informações de estado do conjunto é posterior ao pretendido. Este atraso é provocado pelo tempo adicional necessário para construir o índice.

Além disso, estes limites de tempo influenciam outros indicadores de estado fornecidos na portlet Gerir Procura. Por exemplo, o número de documentos apresentados para uma origem de conteúdo poderá ser inesperadamente reduzido ou mesmo zero, até a sequência de hiperligações nessa origem de conteúdo estar concluída.

Actualizar diferentes tipos de origens de conteúdo

Fazer clique em Iniciar a ferramenta de sequências de hiperligações actualiza o conteúdo da origem de conteúdo através de uma nova execução da ferramenta de sequências de hiperligações. Durante a execução, o ícone muda para Para ferramenta de sequências de hiperligações. Pode fazer clique para terminar a execução. A procura do portal actualiza as diferentes origens de conteúdo da seguinte forma:
  • Para origens de conteúdo de sítios da Web, os documentos que foram indexados anteriormente e que ainda existem na origem de conteúdo são actualizados. Os documentos que foram indexados anteriormente mas que já não existem são mantidos no conjunto de procura. Os documentos novos na origem de conteúdo são indexados e adicionados ao conjunto.
  • Para sítios do WebSphere Portal, a sequência de hiperligações adiciona todas as páginas à origem de conteúdo. Elimina as portlets e as páginas estáticas da origem de conteúdo que tenham sido removidas do portal. A sequência de hiperligações funciona de um modo semelhante à opção Recolher novamente documentos da origem de conteúdo.
  • Para sítios do IBM® Web Content Manager, a procura do portal utiliza um método de sequência de hiperligações incremental. Para além do conteúdo adicionado e actualizado, a Seedlist especifica explicitamente o conteúdo eliminado. Por outro lado, ao fazer clique em Recolher novamente documentos da origem de conteúdo, é iniciada uma sequência de hiperligações completa. Esta não continua a partir da última sessão, pelo que, não é incremental.
  • Para origens de conteúdo criadas com a opção de fornecedor de seedlist, uma sequência de hiperligações num sistema remoto que suporte a sequência de hiperligações incremental, tal como o IBM Connections, tem um comportamento semelhante a uma sequência de hiperligações num sítio do Web Content Manager.

Definir um ID de utilizador da ferramenta de sequências de hiperligações dedicado

É vantajoso definir um ID de utilizador dedicado para a ferramenta de sequências de hiperligações. A procura do sítio do portal predefinida configurada previamente utiliza o ID de utilizador do administrador predefinido wpsadmin com a palavra-passe predefinida desse ID de utilizador para a ferramenta de sequências de hiperligações. Caso tenha alterado o ID de utilizador do administrador predefinido durante a instalação do portal, a ferramenta de sequências de hiperligações utiliza esse ID de utilizador predefinido. Se tiver alterado o ID de utilizador ou a palavra-passe do ID de utilizador administrador e continuar a pretender utilizá-lo para a ferramenta de sequências de hiperligações da Procura do portal, terá de adaptar as definições.

Para definir um ID de utilizador da ferramenta de sequências de hiperligações, seleccione o separador Segurança e actualize o ID de utilizador e a palavra-passe. Faça clique em Guardar.

Alterar o âmbito de origem

Se modificar uma origem de conteúdo que pertença a um âmbito de procura, actualize o âmbito manualmente para se certificar de que esse âmbito ainda abrange a origem de conteúdo. Se tiver mudado o nome da origem de conteúdo, edite o âmbito e certifique-se de que a origem de conteúdo ainda é apresentada nessa lista. Caso contrário, terá de adicionar a mesma novamente.