Sign up & Download
Sign in

Sistema de Gerenciamento Eletrônico de Documentos: uma ferramenta para otimizar a produtividade do conhecimento

by Daniel Arndt Alves
Dados (2005)

Abstract

The amount of documents produced annually in the world is growing in an exponential way. In a global market, as much the companies as the organizations they need the access to the this gigantic amount of documents in the smallest possible period, because it becomes a competitive factor the capacity of the same to transform these data in knowledge and technology. A great need appears starting from this immense volume of information: the need of systems of administration of documents that provide a fast and necessary access to the information contained in this documental mass. The need of a constant updating on new technologies and market trends became the incentive for the development of a system for the administration of this great mass of information, in way to take advantage to the maximum now the available resources wants is at traditional libraries, it wants available online, through the Internet, for the construction of private knowledge and a fast application of these new concepts and technologies in projects and developed applications. The methodology used in the development of this solution was the study initially on the dimension and the problem of the administration of documents, later investigating the existent solutions in the market, finally establishing the requirements that the system should supply. The present work presents a proposal of a System of Electronic Administration of Documents, which can be used from small atmospheres (a single computer Desktop) even in great companies, controlling a great documental mass, being accessed by many concurrent users, activating like this the changes of information among the users and improving the techniques of sharing of such information among the users groups, it wants in academic, or business context.

Cite this document (BETA)

Available from Daniel Arndt Alves's profile on Mendeley.
Page 1
hidden

Sistema de Gerenciamento Eletrônico de Documentos: uma ferramenta para otimizar a produtividade do conhecimento

UNIVERSIDADE PRESBITERIANA MACKENZIE
FACUlDADE DE CoMPUTAção E INFoRMáTICA
BAChARElADo EM CIêNCIA DA CoMPUTAção
Trabalho de Graduação Interdisciplinar
DANIEl ARNDT AlVES
Sistema de
Gerenciamento Eletrônico de
Documentos:
uma ferramenta para otimizar
a produtividade
do conhecimento
São Paulo
2005
Page 2
hidden
UNIVERSIDADE PRESBITERIANA MACKENZIE
FACUlDADE DE CoMPUTAção E INFoRMáTICA
BAChARElADo EM CIêNCIA DA CoMPUTAção
Trabalho de Graduação Interdisciplinar
DANIEl ARNDT AlVES
Sistema de
Gerenciamento Eletrônico de
Documentos:
uma ferramenta para otimizar
a produtividade
do conhecimento
Trabalho de Graduação Interdisciplinar
apresentado à Faculdade de Computação
e Informática da Universidade Presbiteriana
Mackenzie, como requisito parcial para a
obtenção do grau de Bacharel em Ciência da
Computação.
orientador: Prof. Dr. Nizam omar
São Paulo
2005
Page 3
hidden
DANIEl ARNDT AlVES
Sistema de Gerenciamento Eletrônico de Documentos:
uma ferramenta para otimizar a produtividade do conhecimento
Trabalho de Graduação Interdisciplinar
apresentado à Faculdade de Computação
e Informática da Universidade Presbiteriana
Mackenzie, como requisito parcial para a
obtenção do grau de Bacharel em Ciência da
Computação.
Aprovado em 19 de Abril de 2005.
BANCA ExAMINADoRA
Prof. Dr. Nizam omar
Prof. Dr. luciano Silva
Prof. Dr. Ismar Frango Silveira
Page 4
hidden
AgrAdecimentos
Ao Prof. Dr. Nizam Omar pela orientação firme, ágil e precisa durante todo o processo
de pesquisa e desenvolvimento deste trabalho.
À Profª. Drª. Pollyana Notagiacomo Mustaro pelo auxílio nas revisões e as valiosas dicas
nas áreas de design e usabilidade.
Ao Prof. Dr. Orlando Monezi Jr. pelo “primeiro incentivo”, no curso de Engenharia
Civil, no desenvolvimento de softwares construídos a partir de conceitos/algoritmos de Cálculo
Numérico estudados em aula.
Ao Prof. Ms. Édson A. R. Barros pelo constante incentivo na busca de maiores informações
“extra-classe”, aprofundando os conceitos básicos vistos em aula e a mudança do ritmo de estudo
habitual, sendo também o “responsável” pela minha “paixão” na área computacional, trazendo-
me ao curso de Ciência da Computação.
Page 5
hidden
resumo
A quantidade de documentos produzidos anualmente no mundo vem crescendo de
forma exponencial. Em um mercado globalizado, tanto as empresas quanto as organizações
necessitam do acesso à esta gigantesca quantidade de documentos no menor prazo possível,
pois torna-se um fator competitivo a capacidade da mesma de transformar estes dados em
conhecimento e tecnologia. Uma grande necessidade surge a partir deste imenso volume de
informações: a necessidade de sistemas de gerenciamento de documentos que proporcionem
um acesso rápido e preciso às informações contidas nesta massa documental. A necessidade
de uma constante atualização sobre novas tecnologias e tendências de mercado tornou-se o
incentivo para o desenvolvimento de um sistema para o gerenciamento desta grande massa de
informações, de forma a aproveitar ao máximo os recursos disponíveis atualmente quer seja
em bibliotecas tradicionais, quer disponíveis online, através da Internet, para a construção de
conhecimentos particulares e uma rápida aplicação destes novos conceitos e tecnologias em
projetos e aplicações desenvolvidas. A metodologia utilizada no desenvolvimento desta solução
foi inicialmente o estudo sobre a dimensão e o problema do gerenciamento de documentos,
posteriormente investigando as soluções existentes no mercado, finalmente estabelecendo os
requisitos que o sistema deveria fornecer. O presente trabalho apresenta uma proposta de um
Sistema de Gerenciamento Eletrônico de Documentos, o qual pode ser utilizado desde pequenos
ambientes (um único computador Desktop) até mesmo em grandes empresas, controlando uma
grande massa documental, sendo acessada por muitos usuários concorrentemente, agilizando
assim as trocas de informações entre os usuários e melhorando as técnicas de compartilhamento
de tais informações entre os grupos de usuários, quer em ambiente acadêmico, ou empresarial.
Palavras-Chave: Gerenciamento Eletrônico de Documentos, Biblioteca Digital, Sistemas
Colaborativos, Sistemas Distribuídos, Inteligência Artificial.
Page 6
hidden
Abstract
The amount of documents produced annually in the world is growing in an exponential
way. In a global market, as much the companies as the organizations they need the access to
the this gigantic amount of documents in the smallest possible period, because it becomes a
competitive factor the capacity of the same to transform these data in knowledge and technology.
A great need appears starting from this immense volume of information: the need of systems
of administration of documents that provide a fast and necessary access to the information
contained in this documental mass. The need of a constant updating on new technologies and
market trends became the incentive for the development of a system for the administration of
this great mass of information, in way to take advantage to the maximum now the available
resources wants is at traditional libraries, it wants available online, through the Internet, for the
construction of private knowledge and a fast application of these new concepts and technologies
in projects and developed applications. The methodology used in the development of this solution
was the study initially on the dimension and the problem of the administration of documents,
later investigating the existent solutions in the market, finally establishing the requirements
that the system should supply. The present work presents a proposal of a System of Electronic
Administration of Documents, which can be used from small atmospheres (a single computer
Desktop) even in great companies, controlling a great documental mass, being accessed by many
concurrent users, activating like this the changes of information among the users and improving
the techniques of sharing of such information among the user’s groups, it wants in academic,
or business context.
Keywords: Electronic Document Management, Digital Library, Collaborative Systems,
Distrubuted Systems, Artificial Intelligence.
Page 7
hidden
Lista de Figuras
Figura 1 - Estrutura do Sistema de Controle proposto ..........................................................9
Figura 2 - Modelo geral de uma Unidade de Processamento ................................................
Figura 3 - Estrutura geral do neurônio nebuloso ...................................................................
Figura 4 - Estrutura de uma sinapse não linear .....................................................................
Figura 5 - Função Membro ...................................................................................................
Figura 6 - Controlador neuro-nebuloso .................................................................................8
Figura 7 - Escopo de um conjunto nebuloso .........................................................................2
Figura 8 - Solução automática para o problema de integridade ............................................
Figura 9 - Máquina de estados finitos para uma busca de múltiplas cadeias de caracteres ..
Figura 10 - Carregando a Tabela de estados Finitos .............................................................
Figura 11 - Tecnologias associadas e relatadas em conjunto com o GED ............................9
Figura 12 - Tipos de Objetos .................................................................................................1
Figura 13 - Ciclo de vida de documentos ..............................................................................
Figura 14 - Componentes típicos de um ambiente de GED ..................................................9
Figura 15 - Integração de sistemas GED com mainframe ....................................................89
Figura 16 - Um modelo simplificado de ERP .......................................................................9
Figura 17 - e-Business e e-Commerce ...................................................................................98
Figura 18 - Resumo da estrutura da “Sociedade da Informação no Brasil” ..........................98
Figura 19 - Esquema de uma aplicação integrada, cedido pela Verity ................................10
Figura 20 - Ciclo de vida representativo de desenvolvimento de software ........................108
Figura 21 - Electronic Document Management Intelligent System - Arquitetura do Sistema
... ..........................................................................................................................................118
Figura 22 - Esquema típico de integração de uma aplicação com o SearchEngine. ..........12
Page 8
hidden
8Figura 23 - Fluxo de indexação de documentos ..................................................................129
Figura 24 - Exemplo de indexação de um documento .........................................................130
Figura 25 - Fluxo de recuperação de dados de documentos ...............................................131
Figura 26 - Diagrama Entidade-Relacionamento do Banco de Dados modelado ..............189
Page 9
hidden
9Lista de tabelas
Tabela 1 - Comparação entre atividades de recuperação de documentos em papel e GED. 
Tabela 2 - Uma visão geral dos tipos, uso e características dos campos de documentos ...142
Page 11
hidden
11
Equação 23: REGRA DE APRENDIzADO ......................................................................0
Equação 24: EqUAçãO DE ADAPTAçãO DOS PARâMETROS DO SISTEMA
NEBUlOSO .............................................................................................................................0
Equação 25: SOlUçãO AUTOMáTICA PARA O PROBlEMA DE INTEGRIDADE 
Equação 26: SOlUçãO AUTOMáTICA PARA O PROBlEMA DE INTEGRIDADE 
Equação 27: CálCUlO DA MATRIz DE DIFERENçAS .............................................
Equação 28: CálCUlO DA MATRIz DE DIFERENçAS .............................................
Equação 29: CálCUlO DA MATRIz DE DIFERENçAS .............................................
Page 14
hidden
14
6.7.2 Gestão documental .......................................................................................................
6.7.3 Departamento de TI (Tecnologia da Informação) .......................................................
6.7.4 Investimentos ................................................................................................................
6.8 COMPONENTES DE UM AMBIENTE TíPICO DE GED ...........................................8
6.8.1 Documentos ..................................................................................................................8
6.8.2 Ambiente Típico ...........................................................................................................9
6.8.3 Sistemas GED...............................................................................................................80
6.8.4 Alguns equipamentos comuns em sistemas de GED ....................................................80
7 TIPos dE solução dE gEd maIs Comuns ..........................................................81
7.1 ClASSIFICAçãO GERAl ...........................................................................................81
7.2 DOCUMENT IMAGING ...............................................................................................81
7.3 DOCUMENT MANAGEMENT ....................................................................................82
7.4 EDMS (ENGINEERING DOCUMENT MANAGEMENT SySTEM) .........................8
7.5 IMAGE ENABlE ...........................................................................................................8
7.6 ERM/COlD ....................................................................................................................8
7.7 FORMS PROCESSING (PROCESSAMENTO DE FORMUláRIOS) ........................8
7.8 WORKFlOW .................................................................................................................8
7.9 CARACTERíSTICAS SECUNDáRIAS PRESENTES EM SISTEMAS GED ............8
7.9.1 Pesquisa de documentos com FTR (Full Text Retrieval) .............................................8
7.9.2 Montagem de mídias independentes do sistema para publicação de documentos ......88
7.9.3 Integração com sistemas legados .................................................................................89
7.9.4 Conversão de formatos de arquivos .............................................................................90
7.9.5 Formulários para criação de novos documentos .........................................................90
7.10 OBJETOS NATIvAMENTE DIGITAIS E ARqUIvOS ..............................................92
Page 15
hidden
15
7.10.1 Visualizadores ............................................................................................................9
7.10.2 Impressão e Plotagem ................................................................................................9
8 ouTros sIsTEmas auxIlIados PElo gEd..........................................................9
8.1 ERP (ENTERPRISE RESOURCE PlANNING) ...........................................................9
8.2 CRM (CUSTOMER RElATIONSHIP MANAGEMENT)............................................9
8.3 E-BUSINESS (ElECTRONIC BUSINESS) ..................................................................9
8.4 KNOWlEDGE MANAGEMENT (GERENCIAMENTO DO CONHECIMENTO) ....98
8.5 FERRAMENTAS DE GROUPWARE (WORKGROUP E WORKFlOW) ..................99
8.6 RECORDS MANAGEMENT/RECORD AND INFORMATION MANAGEMENT
(RM/RIM) ...........................................................................................................................100
8.7 CONTENT MANAGEMENT/ENTERPRISE CONTENT MANAGEMENT (CM/
ECM) ...................................................................................................................................101
8.8 PDM (PRODUCT DATA MANAGEMENT) ...............................................................102
8.9 ENTERPRISE APPlICATION INTEGRATION (EAI) ..............................................10
8.10 COMO O GED PODE AUxIlIAR A ESTES E OUTROS SISTEMAS ...................10
9 ImPlanTação dE um ProjETo dE gEd .............................................................10
9.1 vANTAGENS DO USO DE UMA METODOlOGIA PARA A IMPlANTAçãO DE
UM PROJETO DE SISTEMA COMPUTACIONAl .........................................................10
9.1.1 Compras .....................................................................................................................10
9.1.2 Desenvolvimento ........................................................................................................10
9.1.3 Implantação ................................................................................................................10
9.2 ESCOlHA DA METODOlOGIA A SER EMPREGADA ..........................................10
9.3 PONTOS COMUNS ENTRE AS DIvERSAS METODOlOGIAS ............................108
9.3.1 Definição da solução ..................................................................................................109
Page 19
hidden
19
A2.3.2.11 PermissionTypeName em 5 é extrínseco? ..........................................................17
A2.3.2.12 PermissionTypeStrength em 5 é extrínseco? ......................................................17
A2.3.2.13 DocumentGroupName em 6 é extrínseco? .........................................................17
A2.3.2.14 DocumentGroupDate em 6 é extrínseco? ...........................................................17
A2.3.2.15 DocumentGroupUpdate em 6 é extrínseco? .......................................................17
A2.3.2.16 Rel_A em 7 é extrínseco? ...................................................................................178
A2.3.2.17 Rel_B em 7 é extrínseco? ...................................................................................178
A2.3.2.18 Rel_E_Min em 7 é extrínseco? ..........................................................................178
A2.3.2.19 Rel_E_Max em 7 é extrínseco? ..........................................................................178
A2.3.2.20 DocumentID em 9 é extrínseco? ........................................................................179
A2.3.2.21 DocumentDataTypeID em 9 é extrínseco? .........................................................179
A2.3.2.22 DocumentData em 9 é extrínseco? .....................................................................179
A2.3.2.23 DocumentName em 11 é extrínseco? .................................................................180
A2.3.2.24 DocumentSize em 11 é extrínseco? ....................................................................180
A2.3.2.25 DocumentDate em 11 é extrínseco? ...................................................................180
A2.3.2.26 DocumentFormat em 11 é extrínseco? ...............................................................181
A2.3.2.27 DocumentPages em 11 é extrínseco? .................................................................181
A2.3.2.28 languageID em 11 é extrínseco? .......................................................................181
A2.4 DECOMPOSIçãO DO ESqUEMA DO BANCO DE DADOS...............................18
A2.5 DIAGRAMA ENTIDADE-RElACIONAMENTO ..................................................189
Page 20
hidden
20
1 introdução
Conforme estudo liderado por lyman e varian (2003), a produção mundial de novas
informações para o ano de 2002 armazenadas em meios impressos, filme, óptico e magnético
foi cerca de 5 hexabytes, o que equivale a cerca de 800 megabytes por cada pessoa na Terra.
Com a globalização, a boa administração das informações não é apenas um diferencial
de qualidade, mas torna-se uma necessidade competitiva para as corporações. Com o aumento
da competitividade, as margens de lucro estão cada vez menores. Desta forma, pequenas falhas
no processo de tomada de decisão tornam-se muito críticas, inviabilizando o negócio, e até
mesmo empresas. Os documentos empresariais estão no centro de cada processo do negócio,
seja para o planejamento futuro, para a tomada de decisões, ou para o desenvolvimento de novos
produtos e serviços. Tais documentos armazenam o conhecimento formado pelas informações
técnicas para a execução das tarefas, pela prática dos negócios da organização, pelas normas e
legislação aplicáveis à produtividade e pelas experiências dos profissionais no exercício de suas
atividades.
Diariamente são criados diversos novos documentos pelas corporações, contudo, perde-
se o controle sobre estes quando os documentos necessários não podem ser encontrados ou
são utilizados em versões obsoletas. Definir a política e as práticas da companhia, ou ajudar a
responder rapidamente aos clientes são atividades diretamente vinculadas ao fluxo interno de
informações.
Segundo dados do Centro Nacional do Desenvolvimento do Gerenciamento da Informação
(CENADEM, 2004), a humanidade gerou nos últimos 50 anos a quantidade de informação
equivalente à dos 5 mil anteriores. Continuando com a tendência atual, do ano de 2004, esse
número duplicará nos próximos 26 meses. Em 2010, a informação duplicará a cada 11 horas.
Conforme a definição do CENADEM, o Knowledge Management, ou Gerenciamento
do Conhecimento é o processo da obtenção, gerenciamento e compartilhamento da experiência
e especialização dos funcionários, tendo como objetivo o acesso a melhor informação no tempo
certo, utilizando-se de tecnologias de forma corporativa. Além disso, ele é o fator para melhorar
o desempenho das empresas através da localização, aplicação e manutenção do conhecimento
que a empresa possui, produz ou adquire. É a forma de acesso a melhor informação em tempo
Page 21
hidden
21
ótimo.
Diversas empresas percebem que o gerenciamento de seu capital intelectual passou a
ser vital no mundo globalizado e competitivo em que vivemos. O tão procurado Knowledge
Management está prometendo sucesso e vantagem competitiva sustentável, sendo o que hoje
todas as empresas necessitam para se manter no mercado.
As empresas, de uma forma geral, produzem e utilizam uma infinidade de documentos
diariamente. Tais documentos representam os processos da empresa, regras internas, informações
em geral, etc. Podemos dizer que a organização é formada pelas informações armazenadas em
seus documentos e pelas pessoas usuárias destas informações.
Com seu consagrado poder de comunicação distribuída, a tecnologia da Internet é
potencialmente o veículo facilitador do acesso das pessoas aos documentos dos quais estas
necessitam. Esta tecnologia pode ser utilizada de forma a permitir que os documentos sejam
acessados pelas pessoas certas, no momento certo, onde quer que estas pessoas estejam.
Neste contexto, surge uma nova tecnologia capaz de ajudar a viabilização de um sistema
que permita organizar, intercambiar e disponibilizar documentos e informações em geral, através
da Internet: os WebServices (segundo o MSDN – Microsoft Developer Network, tecnologia para
que diferentes empresas, mesmo utilizando distintas tecnologias e plataformas, conectem-se de
maneira padrão, executem procedimentos remotos sobre o protocolo HTTP, o que possibilita seu
uso por meio de firewalls, sem necessidade de abrir brechas na segurança corporativa).
Em vez de ter e manter todos os sistemas, cada vez mais as corporações estão comprando
serviços dos provedores de WebServices. Através do “aluguel” de aplicações comerciais, tais
como e-Commerce, ERP, CRM e até mesmo GED (Gerenciamento Eletrônico de Documentos),
as empresas podem dispensar operações que não fazem parte de seu foco de negócio. Elas
alavancam a tecnologia da informação empregando recursos humanos de especialistas externos.
Ao mesmo tempo, evitam investimentos em hardware, software e os custos associados com a
integração entre seus sistemas existentes e os novos sistemas implantados.
De acordo com a definição da AIIM (Association for Information and Image Management)
Enterprise Content Management (ECM) ou Gerenciamento de Conteúdo Empresarial são as
tecnologias, ferramentas e métodos usados para captar, gerenciar, armazenar, preservar e distribuir
Page 27
hidden
27
( )S p é estritamente decrescente, ou seja, se p q< então ( ) ( )S p S q> .
Agora temos o teorema:
“Se ( )S p satisfaz todos os axiomas (1) a (4), então:
( ) ( )2logS p C p= − ⋅
Por simplicidade, consideramos 1C = e a unidade de medida de surpresa em bits.
vamos considerar uma variável aleatória X , a qual pode assumir um dos seguintes valores
1 2, ,..., nx x x , com respectivas probabilidades 1 2, ,..., np p p . Então, a quantidade esperada de
surpresa que se deve receber sob o aprendizado de X é:
( ) ( )logi iH X p p= − ⋅∑
axioma 2
( )S p é contínua.
axioma 3
( ) ( ) ( )S pq S p S q= + .
axioma 4
Equação 1
onde C é um número inteiro positivo arbitrário.
Teorema 1
Equação 2: Entropia de Informação
( )H X é a entropia de informação da variável aleatória X e pode ser interpretada
como sendo a quantidade média de surpresa que se recebe por tomar conhecimento de X ou a
quantidade de incerteza que existe para com o valor de X . Pode ser observado também como
a média da quantidade de informação recebida quando o valor de X é observado.
Conforme a explicação de Mackay (1995), a entropia de X , ou seja, ( )H X é uma medida
de informação por estar relacionando com o número real de bits necessários para especificar, em
média, o resultado de um experimento.
Os conceitos de Teoria da Informação apresentados são empregados neste trabalho,
predominantemente no módulo de armazenamento de dados (Repository Server), o qual efetua
a compactação dos documentos recebidos dos usuários, visando minimizar o espaço necessário
para o armazenamento do repositório de documentos.
Page 32
hidden
32
estratégias e desenvolver métodos automatizados de filtragem, seleção e interpretação de dados.
As organizações que primarem pela realização disso terão maiores chances de sobrevivência.
Por conta disso, a informação em si tem se tornado um fator de produção de importância.
As maiorias das organizações possuem grandes bancos de dados que contém uma grande
riqueza de informações potencialmente acessíveis. Contudo, é geralmente muito difícil de
saber o que acessar dentre tantas informações. Tal como na mineração, enormes quantidades de
detrito precisam ser removidas para se encontrar diamantes ou ouro. A analogia que, com um
computador, pode-se automaticamente encontrar o “diamante-informação” entre toneladas de
“dados-detritos” na sua base de dados é obviamente muito atraente.
O termo KDD (Knowledge Discovery in Databases) deve ser empregado para descrever
todo o processo de extração do conhecimento dos dados. Nesse contexto, conhecimento significa
relacionamentos e padrões entre dados elementares. O termo Data Mining deve ser utilizado
exclusivamente para o estágio de descoberta, integrante do processo de Knowledge Discovery
in Databases.
Certas questões que poderiam ser feitas podem ser facilmente respondidas usando
simples comandos em linguagem SQL (Structured Query Language). Por exemplo: “quem
comprou determinado produto em que data?”. Existe, entretanto, conhecimento escondido na
sua base de dados que são muito difíceis de se encontrar utilizando apenas o SQL, por exemplo:
“qual o melhor perfil dos meus clientes?”, ou “quais são as mais importantes tendências no
comportamento consumidor?”. É claro que estas questões podem ser respondidas utilizando
apenas a linguagem Sql, porém, desta forma, pode-se levar um tempo enorme até se chegar às
respostas, enquanto que algoritmos de aprendizado de máquina baseados em redes neurais ou
algoritmos genéticos, podem encontrar automaticamente a resposta em tempo muito menor. Uma
vez que a ferramenta de mineração de dados encontrou a segmentação, pode-se utilizar Sql
novamente para analisar os perfis encontrados. Poderia-se dizer que se é sabido exatamente o
que quer encontrar, deve-se utilizar Sql, mas se o que souber é apenas vagamente o que quer,
utilize Data Mining. Geralmente há mais ocasiões onde sua abordagem inicial é vaga do que às
vezes em que você sabe precisamente o que está procurando. Esta é a motivação para o interesse
crescente em Data Mining.
Page 39
hidden
9
figura 1 - Estrutura do Sistema de Controle proposto
Propomos o fechamento do ciclo, caso atue-se sobre um processo dinâmico ou queira-se
refinar ainda mais o conhecimento por meio de uma nova etapa de aprendizado. O conhecimento
obtido é usado então como ponto de partida de um novo ciclo de aprendizado após validação do
conjunto de regras “se ... então” extraídos. Os exemplos para o treinamento podem ser recalculados
no início de cada novo ciclo levando-se em conta o estado atual em que se encontra o sistema
de controle e o objetivo para o qual o mesmo foi elaborado.
comportem as melhores características de sistemas nebulosos e as melhores redes neuronais,
ou seja, a capacidade de representação do conhecimento do primeiro e habilidade de aprender
do segundo.
No framework ilustrado na Figura 1, o aprendiz primeiro insere informação simbólica
de algum tipo numa rede neural. Iniciar uma rede neural com conhecimentos prévios aumenta
consideravelmente a velocidade de convergência do treinamento da mesma. Esta inserção de
conhecimentos pode ser feita, por exemplo, configurando-se os neurônios da camada escondida
da rede neural, para fazerem as mesmas deduções que uma regra conjuntiva. Uma vez na
representação neural, o aprendiz usa exemplos de treinamento para refinar o conhecimento prévio.
quando o algoritmo de back propagation ajusta os pesos para reduzir o erro, está indiretamente
refinando o conhecimento simbólico inicial. Por exemplo, ele pode eliminar um antecedente
desnecessário (“pré-condição”) de uma regra, fazendo seu peso correspondente na rede ser zero,
ou abaixo de um valor limite de influência. O aprendiz, então extrai informação simbólica da
rede treinada. Neste passo, o conhecimento refinado contido na rede é convertido de volta em
representação simbólica, facilitando a inspeção humana do que foi aprendido. Este processo
segue o descrito por Shavlik (1995).
Page 40
hidden
40
A diferença básica entre um sistema neural em malha aberta para o nosso sistema em malha
fachada, consiste no fato de que no primeiro existem duas etapas de interesse: o treinamento e
a aplicação, e no segundo, apenas uma: o treinamento aplicado. Em outras palavras, o sistema
proposto em malha fechada com exemplos de treinamento recalculados a cada ciclo consiste em
um sistema de controle de aprendizado contínuo.
3.2 Lógica Nebulosa
Segundo Mendel (1995), um conjunto nebuloso F num universo de discussão U é
caracterizado pelo valor de uma função membro ( )F xm a qual leva valores no intervalo entre 0
e 1. Assume-se que U é o subconjunto do conjunto dos números reais. Conseqüentemente, um
conjunto nebuloso F em U pode ser representado como um conjunto de pares ordenados de um
elemento genérico x e o valor de sua função membro, isto é,
( )( ){ }, |FF x x x Um= ∈
Equação 3: Função de um Conjunto Nebuloso
A função de pertinência provê uma medida do grau de similaridade de um elemento em
U com o conjunto nebuloso.
variáveis ou etiquetas lingüísticas, cujos valores não são números, mas sim palavras
em sentenças ou linguagens artificiais, são pesadamente usadas em lógica nebulosa como,
por exemplo: alto, médio e baixo. O nome da variável é denotado por u; valores numéricos
da variável lingüística são denotados por x. Em aplicações de lógica nebulosa em engenharia,
funções membros são associadas a termos que aparecem nos antecedentes ou conseqüentes das
regras. As formas mais usadas de funções membros são triangular, trapezoidal, linear e gaussiana.
Funções membro assumem valores geralmente entre zero e um, e pode haver sobreposições.
Estas sobreposições são uma das maiores forças da lógica nebulosa, pois permitem que uma
entrada seja distribuída ao longo de várias regras.
As operações fundamentais na teoria convencional de conjuntos são união, interseção e
complemento. Seja A um conjunto, então A é seu complemento. As duas leis fundamentais da
teoria clássica de conjuntos são:
1. lei do meio excluído: A A U∪ =
Page 41
hidden
41
2. lei da contradição: A A∩ =∅
Ambas leis não são válidas na lógica nebulosa. Nela, união, intersecção e complemento são
definidos em termos de suas funções de pertinência, ora estendendo, ora generalizando funções
de pertinência equivalentes da teoria clássica de conjuntos. Sejam os conjuntos nebulosos A e
B descrito por suas funções de pertinência ( )A xm e ( )B xm . Uma definição mais comum de
união (“OU” lógico) nebulosa é a função membro
Equação 4: Função de União Nebulosa
( ) ( ) ( )max ,A B A Bx x xm m m∪ =   
e uma definição mais comum de intersecção (“E” lógico) nebulosa é a função membro
Equação 5: Função de Intersecção Nebulosa
( ) ( ) ( )min ,A B A Bx x xm m m∩ =   
Adicionalmente, complementando (“NãO” lógico) nebuloso é geralmente dado por:
Equação 6: Função de Negação Nebulosa
( ) ( )1A Ax xm m= −
Outras importantes noções da teoria de conjuntos nebulosos são:
• relações nebulosas – exemplo: “u é consideravelmente maior do que v”.
• Composição de relações nebulosas no mesmo Espaço Produto – exemplo: “u é
consideravelmente maior do que v ou v é muito próximo de u”
• Composição de relações nebulosas em Espaço Produto deferentes – exemplo: “u
é menor que v, e v é próximo de w”
• Composição de relações nebulosas em Espaço Produto diferentes, em que uma
relação é apenas um Conjunto nebuloso – exemplo: “v é de médio para grande e w é menor
que v”).
A relação implicação nebulosa pode ser definida como sendo a função membro
Equação 7: Função de Implicação Nebulosa
( ) ( ) ( ) ( )( ) ( )A B A B A Bx x x x xm m m m m→ = → = ¬ ∨
cuja expressão é similar à encontrada na lógica clássica.
O principal uso de lógica nebulosa se dá através da expressão conhecimento humano na
forma de regras lingüísticas “se ... então”. Cada regra possui duas partes: antecedente ou premissa
Page 45
hidden

da RNA. Nesta fase a regra de aprendizado é usada para mudar os valores dos elementos da
matriz W e outros parâmetros adaptáveis que a rede possa ter. neste contexto, “aprendizado” e
“adaptação” são vistos como simplesmente mudanças nos parâmetros da rede. Nos modelos de
RNA, normalmente, o ambiente externo provê um conjunto de valores de entrada de treinamento.
Existem dois tipos principais de aprendizado: supervisionado e não supervisionado.
No aprendizado não supervisionado o ambiente externo não provê a saída desejada da
rede e nem a classifica como má ou boa. Usando a correlação dos vetores de entrada, a regra
de aprendizado muda os pesos da rede de forma a agrupar os vetores de entrada em “classes”,
fazendo com que os vetores de entrada similares produzam saídas similares desde que pertençam
a uma mesma classe. Idealmente, a regra de aprendizado encontrará o número de classes e seus
respectivos centros, se eles existirem, para os dados de treinamento. Este método de aprendizado
é também denominado de auto-organização.
De acordo com sua topologia, uma RNA pode ser classificada como RNA feedfoward
ou feedback, esta última também denominada de RNA recorrente. Em uma RNA feedfoward
uma unidade envia seu sinal de saída para unidades das quais ela não recebe sinais direta ou
indiretamente. Em outras palavras, não há malhas fechadas.
Em geral, dada uma RNA feedfoward, numerando propriamente as unidades pode-se
definir uma matriz W a qual seja triangular e tenha sua diagonal principal toda igual a zero, de
modo que a unidade não se auto-alimenta. Uma RNA feedfoward organizada em camadas, onde
as unidades são conectadas apenas a unidades situadas na camada seguinte é chamada de RNA
estritamente feedfoward. Numa rede feedback é permitido a existência de malhas fechadas. Uma
RNA feedfoward implementa um mapeamento estático de suas entradas nas suas saídas enquanto
que uma RNA feedback é, em geral, um sistema dinâmico não-linear e, portanto, a estabilidade
da rede é uma das principais preocupações.
Page 46
hidden

3.4 Neurônios Nebulosos
A estrutura teórica, segundo Godjevac (1995), do neurônio nebuloso é mostrada nas
Figuras 3 e Figura 4. Desde que ele tem que ser capaz de lidar com informações nebulosas, suas
entradas são variáveis nebulosas 1... nx x no universo de discussão 1... nU U , respectivamente. Esses
conjuntos nebulosos podem ser rotulados por termos lingüísticos, como quente, alto, largo, etc.
Primeiro, eles são ponderados, mas de uma forma diferente que nas RNA padrão. Em seguida,
as entradas são agregadas pela operação nebulosa, a qual é, em geral, a função de implicação
nebulosa.
figura 3 - Estrutura geral do neurônio nebuloso
figura 4 - Estrutura de uma sinapse não linear
Page 47
hidden

O modelo adotado para o neurônio nebuloso é uma tentativa de se usar regras lingüísticas
“se ... então”. A experiência do neurônio é armazenada no operador nebuloso, o qual é usualmente
uma norma T ou co-norma T. É composto pelas entradas atuais e pela experiência passada.
Assuma que se tenham m entradas 1 2, ,..., mx x x e uma saída y e que seja definidas n regras
lingüísticas da forma seguinte: iR : se 1x está em 1iA e 2x está em 2iA e ... e mx está em imA
então y é iw , 1,..,i n= , onde i é o índice da regra, ijA é um conjunto nebuloso para a i-ésima regra
e j-ésima variável lingüística definida sobre o universo de discussão para a j-ésima variável e
iw é um número real que representa a parte conseqüente.
Cada função membro é definida como simétrica e triangular e deve ser parcialmente
diferenciável, como ilustrado na Figura 5. A definição dos valores membros é dada pela equação
seguinte, onde, para cada entrada, o universo de discussão está definido:
( )2
1
j ij
ij
ij
abs x a
b
m
 ⋅ −
 = −   
, para
2 2
ij ij
ij j ij
b b
a x a− < < + , 0ijm = , caso contrário
Equação 13: Definição do Universo de Discussão
figura 5 - Função Membro
Equação 14: Força de disparo das regras de inferência nebulosa
Para aplicação das regras, precisa-se definir uma interferência nebulosa e, neste caso,
será usado o operador produto como norma T. Isto significa que a força de disparo de cada regra
será dada pela seguinte equação:
1 2
1
...
n
i i i in ij
j
u m m m m
=
= ⋅ ⋅ ⋅ =∏
Page 49
hidden
9
3.5 Aprendizado do Sistema de Controle
Conforme Godjevac (1995), suponha que o modelo paramétrico de um sistema não-linear
seja o seguinte:
( ), , ,dx f x u z t
dt
= , ( ), , ,y g x u z t=
Equação 16: Modelo paramétrico de um sistema não linear
onde x seja o vetor de entrada, u o vetor de estado, z um vetor de parâmetros e y o vetor
de saída. O problema do aprendizado é um problema de estimação de parâmetros. Todas as
soluções de problemas de estimação de parâmetros consistem em encontrar o extremo (máximo
ou mínimo) da função critério (custo) V considerada a função de parâmetros de um sistema
desconhecido. A função minimizar é a seguinte:
( ) ( ) ( )( )21
2 d
V z y t y t= −
Equação 17: Função de minimização
onde dy é a saída desejada (treinamento) provida por um especialista no domínio em
estudo. A minimização dessa função pode ser feita de várias formas. Será explicado o método de
aproximação estocástica para identificar os parâmetros do sistema nebuloso. Isto é um processo
iterativo dado pela seguinte equação:
( ) ( ) ( )( )1 zz t z t V z t+ = +Γ∇
Equação 18: Método de aproximação estocástica
onde z é o vetor de parâmetros a adaptar, Γ é uma constante predefinida conhecida por
taxa de aprendizado, e zV−∇ é a notação para o gradiente de V com respeito a z, a saber:

1
,...,z
n
V V
V
z z
 ∂ ∂∇ =  ∂ ∂ 
Equação 19: Gradiente de V com respeito a z
No controlador neuro-nebuloso já mostrado, z é dado pela seguinte notação:
( )11 11 1,..., , ,..., , ,...,nm nm nz a a b b w w=
Equação 20: Notação de z no controlador neuro-nebuloso
O número de parâmetros a estimar é
2p nm n= +
Equação 21: Número de parâmetros a estimar
Page 51
hidden
51
3.6 Extração de Conhecimento
Este sistema de controle é muito interessante por que ele tem a habilidade de expressar
o conhecimento adquirido de um conjunto de dados de entrada e saída na forma de regras
lingüísticas. A extração de regras pode ajudar a entender o que a rede neural modelo caixa preta
aprendeu.
Da forma como o sistema de controle foi proposto, têm-se as regras extraídas de imediato,
uma vez que as mesmas são colocadas de forma geral, na forma de parâmetros ajustáveis e tem-se
acesso aos valores desses parâmetros a cada instante. No entanto, podem-se ter diversos problemas
associados às regras geradas pelo algoritmo de aprendizado. Dentre esses problemas, pode-se
citar: regras equivalentes ou quase equivalentes (redundância de regras), regras contraditórias
ou quase contraditórias (problemas de integridade), parâmetros que variam demais causando
incompatibilidade entre sua interpretação inicial e sua interpretação final (variáveis lingüísticas),
regras incompreensíveis e sem sentido semântico, etc. Além disso, há também o problema de
a quantidade de regras inicialmente propostas não ser suficiente para modelar o sistema em
estudo.
3.7 Validação de Regras
Esta validação das regras poderia ser realizada por um conhecedor do domínio, mas aqui se
propõe um sistema automático que irá atacar alguns dos problemas citados na seção anterior.
O problema da quantidade de regras inicialmente propostas não ser suficiente para modelar
o sistema em estudo será minimizado, tentando-se gerar o máximo possível de combinações de
variáveis lingüísticas para formas as regras inicialmente propostas ao sistema. Essas regras, por
menores que fiquem os pesos, não devem ser completamente eliminadas, mesmo que representem
inconsistências, pois, caso o sistema em estudo seja dinâmico, essas regras podem voltar a serem
ativas e, conseqüentemente, ter maior peso.
Essa decisão tomada certamente implicará na diminuição da performance do sistema, e
é possível que não se possa mesmo gerar todas as combinações possíveis por uma limitação de
hardware. Entretanto, como o próprio formato dos conjuntos nebulosos são adaptativos, supõe-se
Page 52
hidden
52
que, ao mesmo que se perca o sentido semântico das variáveis lingüísticas associadas, no caso
de variações radicais, eles irão se moldar ao sistema encobrindo a ausência de combinações de
regras.
De acordo com Damski (1988), para se criar essas combinações de premissas, basta usar
o operador lógico “AND” nas premissas e ter-se apenas uma conseqüência, pois outros tipos de
combinações podem ser reduzidos a esse caso, da seguinte maneira:
1. Se P ou Q então R, reduz-se em
Se P então R, e
Se Q então R.
2. Se P então Q ou R, reduz-se em
Se P e Q¬ então R, e
Se P e R¬ então Q.
. Se P então Q e R, reduz-se em
Se P então Q, e
Se P então R.
Para resolver problemas de integridade é necessário definir o conceito de escopo de
um conjunto nebuloso, criado na presente dissertação. Escopo ou contexto de um conjunto
nebuloso seria o subconjunto do universo de discussão onde aquele conjunto nebuloso pode
estar definido. Na prática seria um intervalo dentro do qual o parâmetro poderia estar contido,
conforme ilustrado na Figura 7.
figura 7 - Escopo de um conjunto nebuloso
Page 54
hidden

onde, minE e maxE são, respectivamente os limites mínimos e máximos do escopo
previamente definido, min'E e max'E são, respectivamente os limites mínimo e máximo do novo
escopo sendo definido, e ija é o parâmetro do conjunto nebuloso que se tornou fora do escopo.
3.8 Cálculo dos Exemplos de Treinamento
O grande diferencial de nossa proposta se encontra na possibilidade de atualização
dinâmica dos exemplos de treinamento. Dessa forma, o sistema de controle neuro-nebuloso
de aprendizado contínuo pode ser definido como um sistema de aprendizado adaptativo, pois
o processo de adaptação do sistema de controle de sistema a ser controlado também se adapta
continuamente à variação dinâmica do comportamento do sistema que se deseja controlar.
Um exemplo de variação de comportamento dinâmico seria um sistema de perseguição
de alvo humanamente controlado e, portanto, com comportamento de longo prazo imprevisível.
longo prazo, nesse caso, seria o tempo necessário para o operador humano ter a idéia para um
novo comportamento e começar a executá-la, ou seja, seria alguns poucos segundos. Porém numa
escala de tempo menor o comportamento pode ser preditável desde que o sistema de aprendizado
contínuo possa ter como parâmetro de onde ele deve chegar exemplos de treinamentos que
reflitam cada nova realidade de comportamento do sistema a ser controlado.
Dessa forma, é necessária a definição de uma forma de calcular os exemplos de treinamento.
Entretanto, não conseguimos chegar ainda a uma solução geral para este problema, ficando talvez
como possibilidade para novas pesquisas futuras. No capítulo seguinte será apresentada a solução
particular para este problema aplicada ao sistema EDMIS, implementado no presente trabalho,
internamente no módulo de indexação de documentos do sistema.
ou, se maxija E> então:

( )
( )
( )
( )
max min
max max
max min
min max minmax min max min
' '1

' ' 

'' '

ij ij
ij
E EE a E a
E E
E a E EE E E E
 −  − = +  =    ⇔−   
   = + ⋅ −− = −    
Equação 26: Solução automática para o problema de integridade
Page 55
hidden

4 organização da informação
Para a recuperação eficiente da informação de uma massa de dados é necessário algum
tipo de organização da mesma. Como o processo de classificação é parte integrante e fundamental
de qualquer tentativa de organização do que seja, apresentam-se, de forma sucinta, alguns pontos
intrínsecos à questão, sob a luz da biblioteconomia, porém enfatizando os conceitos generalizáveis
a qualquer processo de classificação.
A organização e classificação das informações contidas nos documentos do Sistema de
Gerenciamento Eletrônico de Documentos é realizada pelo módulo responsável pela indexação
dos documentos (Index Server), através do uso dos conceitos de Teoria da Classificação,
apresentados neste capítulo, o sistema é capaz de realizar a classificação de documentos que
tratam de assuntos correlatos. Ao realizar uma pesquisa em seus índices, o sistema proposto
não retorna apenas o resultado literal do termo que fora solicitado pelo usuário, mas também
resultados que apresentam correlação com o termo solicitado.
4.1 Teoria da Classificação
Segundo Barbosa (1969), durante muitos séculos a organização dos livros de uma
biblioteca foi feita apenas com a finalidade de preservá-los para a posteridade. Nas bibliotecas da
Antigüidade, os livros eram armazenados e pouco consultados. O conceito moderno de biblioteca
como um organismo vivo teve origem no século xIx, com a disseminação das universidades e,
conseqüentemente, com o surgimento das bibliotecas universitárias, públicas, etc. A partir deste
momento o livro passou a existir para ser usado.
Com a adoção do sistema de livre acesso, os bibliotecários sentiram, cada vez mais, a
necessidade de uma arrumação sistemática, que reunisse os livros pelos assuntos que encerram,
a fim de melhor atender aos interesses dos leitores. E, assim, surgiram os grandes sistemas de
classificação, muitos dos quais, como os decimais, com algumas modificações, são hoje usados
nas bibliotecas de todos os países.
Classificar é na realidade a tarefa mais importante de uma biblioteca, pois constitui o
meio pelo qual os livros são utilizados. Classificação é definida como sendo um processo mental
Page 56
hidden

pelo qual coisas, pensamentos ou seres são reunidos segundo as semelhanças ou diferenças que
apresentam.
Para que exista o agrupamento das coisas, semelhantes ou não, é preciso um elemento de
ligação que sirva de base para a reunião. Esse elemento chama-se característica da classificação.
Por exemplo, para separar pessoas em subgrupos pode-se utilizar como característica a idade
ou a cor das roupas.
Ainda segundo a autora citada anteriormente, Predicado é cada uma das cinco relações
que se seguem num arranjo lógico: Classe (genus), Espécies (species), Diferença (difference),
Propriedade (property) e Acidente (accident). Uma classe pode ser dividida em espécies
(subdivisão com atributos comuns), pelo acréscimo de uma diferença (característica). A soma
desses subgrupos, ou sejam, das espécies, forma uma classe (genus). Uma espécie pode novamente
se subdividir pelo acréscimo de uma nova diferença e, nesse caso se constitui numa nova classe,
originando novas espécies e assim sucessivamente. Propriedade significa algo próprio de cada
elemento de uma classe, mas que não é imprescindível à definição da classe. Acidente é uma
qualidade não obrigatória a todos os elementos de uma classe.
Essas subdivisões sucessivas explicam, num sistema de classificação, a gradação dos
assuntos, isto é, dos termos de grande extensão, para assuntos específicos, ou seja, para termos
de grande intenção. Em todos os sistemas de classificação, a divisão deve partir do geral para
o particular.
A classificação tem por finalidade primordial arrumar as informações da melhor maneira
para uso. Esta melhor maneira consiste em permitir a localização e o acesso às informações dentro
do universo em questão e inserir novas informações sem que se perca a ordem lógica.
As características usadas para subdivisão das informações por assuntos devem ser
empregadas de maneira exclusiva, uma de cada vez e de maneira exaustiva, isto é, devem dividir
os grupos até que não comportem mais subdivisões e permitir que novos assuntos lhes sejam
anexados.
Para que haja seqüência lógica nessa divisão dos grupos, é preciso que a característica
escolhida seja dirigida pelos seguintes princípios:
• Ser a mais útil.
Page 61
hidden
61
algoritmos usados para estruturar as classes hierarquicamente. A combinação de técnicas usada
é o que diferencia uma abordagem de classificação automática de outra.
Associação automática de documentos a categorias, ainda de acordo com Svenonius
(1996), toma por entrada um texto, em linguagem natural, e retorna por saída um conjunto
de descritores para aquele texto. Os descritores podem ser termos de um índice ou nomes
das categorias. Duas abordagens básicas para este caso são a análise lingüística e os sistemas
especialistas que “aprendem” a classificação, “estudando” um conjunto previamente classificado
de documentos.
Um hipertexto consiste, segundo Svenonius (1996), em uma rede de nós, os quais
são fragmentos de textos e relacionamentos conectando os nós (links). Estes links podem ser
predefinidos ou definidos pelos usuários. Usando esses links, os usuários podem navegar através
de um texto de nó em nó. Devido às virtudes de facilidade de leitura, aumento na velocidade de
leitura, facilidade para atualização em tempo real, capacidade de representar uma variedade de
estruturas e sua flexibilidade de visualização, os sistemas de hipertexto podem de fato aumentar a
capacidade intelectual do leitor, por liberá-lo da visão limitada do conhecimento emoldurado em
sistemas tradicionais de classificação, projetados sob o paradigma linear de arranjar as partículas
de conhecimento em prateleiras. O hipertexto permite a evolução do documento linear para uma
representação em grafo de acessibilidade.
Essas abordagens, como exemplos do estado da arte em sistemas de classificação de
conhecimento, não possuem completude isoladamente e mesmo em associação não são capazes
de cobrir de forma geral um sistema complexo de conhecimento. Elas, assim como outras não
citadas no presente trabalho, são ainda objeto recente de pesquisa, possuindo, desta forma,
incongruências ou aspectos não abordados. Um aspecto de grande relevância, cujas pesquisas
ganharam grande impulso a partir da década de 1990 por começarem a apresentar resultados
práticos e economicamente viáveis, é como lidar com as incertezas e ambigüidades.
Segundo varzigiannis e Halkidi (2000), na grande maioria dos sistemas de KDD cada
elemento é classificado pela associação a uma dentre um conjunto de possíveis categorias
resultantes de um processo de agrupamento. Dessa forma, existem dois casos onde o conhecimento
pode ser extraído parcialmente ou até não ser extraído pelo processo de KDD. São eles os
Page 62
hidden
62
seguintes:
• os clusters não se sobrepõem – Isso significa que cada elemento na base de dados
pode ser classificado em no máximo apenas um agrupamento. A experiência prática do dia-a-dia
nos diz que, na verdade, deveria ser possível classificar um determinado elemento em mais de
uma categoria. Por exemplo, uma pessoa do sexo masculino de 1,83 metros de altura, no Brasil,
é considerada alta, enquanto que na Europa Central seria de estatura mediana.
• Os valores dos dados são tratados igualmente no processo de classificação – Em
sistemas tradicionais de mineração de dados, os elementos na base de dados são classificados nas
categorias disponíveis de forma nítida e inequívoca. Ou seja, um elemento pertence à determinada
categoria ou não. A pessoa do exemplo anterior é então considerada tão alta como quanto uma
outra pessoa de 1,99 metros de altura. Salta aos olhos, no entanto, que a segunda pessoa satisfaz
com um grau maior do que a primeira, o critério de pertinência na categoria “alto”.
Fica claro, em breve análise acima, que existe conhecimento interessante e possivelmente
importante que não é capturado devido à incerteza não ser considerada no processo de KDD. A
ferramenta matemática-computacional para se lidar com as incertezas é a lógica nebulosa que
mostra como tratar os meios termos que não os extremos binários 1 ou 0. Nos capítulos seguintes
apresenta-se um pouco mais sobre este assunto.
Page 63
hidden

5 emparelhamento de cadeia de caracteres
Dois algoritmos muito importantes para este trabalho de pesquisa são apresentados a
seguir: algoritmo de casamento aproximado de cadeias de caracteres e algoritmo de busca de
múltiplas cadeias de caracteres. O primeiro visa gerar uma idéia nebulosa das palavras-chave que
serão associadas aos documentos, e o segundo melhorar a performance de busca nos documentos
previamente cadastrados de novas palavras-chave adicionadas.
5.1 Algoritmo de Emparelhamento Aproximado de Cadeia de
Caracteres
Apesar da existência de novos algoritmos para o Emparelhamento Aproximado de Cadeia
de Caracteres, na implementação do Sistema de Gerenciamento Eletrônico de Documentos
proposto neste trabalho foi utilizado o algoritmo de Binstock e Rex (1995), pois este algoritmo
possui um baixo consumo de memória, aliado a sua simplicidade na implementação e a uma
performance aceitável nas buscas a serem realizadas pelo componente Index Server do sistema.
Em futuras atualizações do mesmo serão executados novos testes comparativos de performance
entre os algoritmos de Emparelhamento Aproximado de Cadeia de Caracteres, visando a utilização
de algoritmos que possuam características de consumo de memória e um tempo de resposta
mínimo nas operações de busca das expressões solicitadas pelos usuários do sistema.
Considere primeiramente um algoritmo de busca de cadeias de caracteres onde a comparação
precisa ser apenas aproximada e o grau de variação aceitável pode ser especificado.
Considere um padrão P e um texto T para ser varrido em busca de P. Conforme Binstock
e Rex (1995), uma comparação k-aproximada de P em T será uma sub-cadeia de caracteres de
T que difere em, no máximo, k lugares de P. As diferenças pode ser qualquer uma dos seguintes
tipos:
• Os caracteres correspondentes em P e T são diferentes.
• P está faltando caractere que aparece em T.
• T está faltando caractere que aparece em P.
Page 66
hidden

A chave para a máquina de estados é a função goto na Figura 9A. Ela define uma árvore
de estados que rastreia tudo o que é lido. Começando no estado 0, examina cada caractere do
texto sob investigação. Por exemplo, se um “a” é visto no estado 0, muda para o estado 8. Um “l”
levaria então ao estado 9. Se, contudo, o próximo caractere não for um “e”, consulta-se Falha[9]
e volta-se para o estado 0. Note-se que do estado 9, goto[9,‘e’] = 10, mas goto[9, qualquer outro
caractere]. Caso se chegue a um estado com uma função Saída não vazia, significa que uma
sub-cadeia de caracteres foi encontrada.
Como se pode ver, uma vez que todas as várias tabelas da Figura 9 estejam disponíveis,
o processo de busca é trivial. Construir estas tabelas é a parte difícil do algoritmo. Este problema
é atacado em duas etapas. Primeiro constrói-se a função goto e passo a passo adiciona-se cada
caractere das palavras a procurar. Por exemplo, para construir a função goto da Figura 9, começa-
se com uma função goto vazia, como ilustrado na Figura 10A, insere-se a palavra tale, como
ilustrado na Figura 10B; a palavra tool, Figura 10C; e finalmente a palavra ale, na Figura
9A. Começa-se a definir a função Saída também nesse momento, fazendo-se com que ao fim
da criação da parte da função goto respectiva a cada palavra, a este estado final, seja associado
com o valor da função Saída a palavra em questão.
figura 10 - Carregando a Tabela de estados Finitos
Page 68
hidden
8
6 gerenciamento eletrônico de documentos (ged)
Segundo o Gartner Goup (1998), GED é a tecnologia que provê um meio de facilmente
armazenar, localizar e recuperar informações existentes em documentos e dados eletrônicos
durante todo o seu “ciclo de vida”.
Deste conceito é possível extrair alguns princípios básicos do GED:
• Possui modo de gerenciamento e visualização de documentos em formato digital, seja
digitalizado (escaneado), em processador de textos, planilha eletrônica, CAD, etc. Um
banco de dados que só gerencia as informações contidas em documentos em papel não
pode ser considerado um GED.
• Utiliza necessariamente computadores.
• Não são sistemas restritos somente a documentos acabados no estágio final de aprovação
ou com um destino ao arquivo. São sistemas que, dependendo de sua necessidade,
podem controlar o documento desde a sua criação.
As literaturas, referências, revistas, feiras e eventos que existem no mercado falam
normalmente de GED de uma maneira pontual que muitas vezes confunde o interessado. Há
diversas situações típicas de mistura de conceitos que deixam claro que existe um pouco de
confusão:
• uma empresa com um sistema de ErP não necessita de um sistema de gEd. Os
ERP’s (SAP, PeopleSoft, J. D. Edwards, Microsiga, etc.) gerenciam, via de regra, dados
em banco de dados. A não ser que possuam módulo especial para isso, não permitem
estrutura de arquivo e modo de trabalho com documentos. Portanto, implantar ERP
não significa diretamente que você terá seus documentos organizados.
• Os Sistemas Contábeis efetuam o controle de toda a documentação fiscal. OK.
Mas se for necessário checar uma nota fiscal, o que tem de fazer? Sair atrás do arquivo
em pastas no outro prédio? Pedir ao arquivista para separar o documento x ou y? Em
quanto tempo você terá essa nota fiscal necessária em mãos?
• o sistema de manutenção controla os equipamentos da empresa, não sendo
necessário a implantação de um sistema de gEd. Certo. Mas como gerenciar a
última versão do desenho do equipamento, comparar versões, visualizar e imprimir os
Page 71
hidden
71
6.2 O Processamento de Objetos Digitais
quando se fala em GED, abre-se uma nova perspectiva de uso de documentos. Não
precisa-se somente gerenciar imagens de documentos em papel, pois agora pode também
gerenciar outros formatos de informação e informação inteligente: “os chamados objetos”. Ao
armazenarmos estes arquivos em Bancos de Dados, utilizamos campos do tipo BlOB (Binary
Large Objects) para o armazenamento destes objetos, que indica qualquer objeto (arquivo) digital
que represente uma informação, como apresentado na Figura 12.
figura 12 - Tipos de Objetos
A utilização de campos do tipo BlOB para o armazenamento dos arquivos digitais em
Bancos de Dados torna-se uma solução melhor do que o uso de outros tipos de campos, por
exemplo os campos do tipo ClOB, pois apesar de utilizarmos arquivos de texto sem formatação
(ASCII), a quantidade destes documentos são muito pequenas se comparados com os demais
documentos presentes no repositório de um ambiente típico (DOC, PDF, RTF, etc.).
Algumas facilidades na integração entre os diversos tipos de documentos são notadas
quando se trabalha com GED:
• Pode-se inserir sons e vídeo como objetos gerenciáveis.
• Uma planilha que atualiza automaticamente um desenho ou texto pode ser
gerenciada.
• Dados de um levantamento de dados podem atualizar automaticamente um relatório.
Entre outros itens, estes vêm reforçando a idéia de que vale a pena pensar em ter um
sistema que armazene de forma eficiente este tipo de informação.
Page 72
hidden
72
6.3 Gerenciamento de Documentos: Dados de Consumo de Tempo
e Dinheiro
Embora os dados citados em seguida não precisem ser coerentes entre si, vale a pena
observá-los para ter-se uma idéia geral sobre o consumo de tempo e dinheiro que ocorre ao
gerenciar documentos:
• Pesquisa da Coopers & Lybrand (antes da associação com Price Watherhouse), USA,
mostra que executivos gastam em média 150 horas/ano procurando, localizando,
solicitando e esperando documentos (1998).
• Em cada 20 documentos, um se perde, segundo a mesma fonte.
• Executivos gastam 20% a 45% do tempo pensando, criando ou manipulando
documentos (Gartner Group/Datapro (1998)).
• Um funcionário guarda em média 20.000 folhas de papel por ano em arquivos dos
mais diversos tipos (Gartnet Group/Datapro (1998)).
• Consome-se de 12% a 15% de renda da empresa.
• “Em média, 90% do tempo de vida útil de um documento é gasto em trânsito e filas.
Ou seja, necessita de gerenciamento”.(Delphi Consulting (1999)).
• “Gastam-se US$ 250,00 para recriar um documento de engenharia perdido” (Coopers
& Lybrand (1998)).
• “As pessoas perdem entre 20% a 30% de seu tempo localizando e recuperando
informações” (Cyco (1996)).
• “Processos trabalhistas são perdidos por não encontrarmos o documento correto no
prazo estipulado por lei” (FEM (1999)).
Os dados citados anteriormente não precisam necessariamente coincidir uns com os
outros. O importante é prestar atenção nas tendências e observações apresentadas quanto ao
comportamento do tipo de tarefa executada, tendo em vista o tempo e dinheiro que poderiam
ser otimizados, trazendo benefícios reais para a corporação.
Não é preciso fazer muito esforço para perceber que o gerenciamento de documentos
consome uma quantidade considerável de tempo dos funcionários, e gerenciar esta tarefa é uma
das formas mais diretas de racionalizar o trabalho desse pessoal.
Page 74
hidden

6.5 Produção Mundial de Documentos
Dependendo da fonte de pesquisa analisada, tomando como base o trabalho de lyman
e varian (2003), perceberá que as estimativas de quantidade de informação que se encontra
em formato digital e papéis variam em torno de 2% a 5% da informação que se encontra em
formato digital. Parte desta informação precisa ser gerenciada, mesmo porque informações não
gerenciadas são difíceis de ser recuperadas e acessadas.
Mesmo se falarmos somente da informação que precisa ser recuperada para consulta,
ainda assim estaremos falando de uma quantidade enorme de documentos que não está em
formato digital e que se estivesse, poderia resultar em vantagem competitiva para a empresa. Não
estamos falando aqui em digitalizar qualquer documento que apareça pela frente sem nenhum
critério, mas de tornar ágil e eficiente a consulta de documentos aos quais seja necessário acesso
muito grande.
O critério da validação da digitalização ou não de um documento será normalmente
a intensidade de consulta a ele, e normalmente um “Plano de Arquivo” eficiente indicará a
necessidade ou não de efetuar a sua digitalização. Não se iluda que irá precisar de uma correta
organização documental se tiver um ambiente de GED.
O GED por si só não organiza de forma adequada sua documentação, e devem existir em
sua empresa documentos sem acesso justificável para montar uma estrutura de digitalização e
controle em GED para eles. Não se pode abrir mão de uma organização coerente do seu arquivo
simplesmente porque ele foi informatizado.
lembre-se da máxima sobre organização em informática: “quem informatiza uma
bagunça terá como resultado uma bagunça informatizada”.
Page 75
hidden

6.6 Comparativo entre atividades de recuperação de documentos:
Papel x GED
atividade Papel gEd
Capturar um documento
São armazenados em
armários e pastas.
Documentos são
digitalizados para gerar
imagens.
Uso de mais de uma forma
de armazenar documentos ou
arquivos setoriais
Cópias são feitas e
armazenadas em diversos
arquivos.
Busca por índices de
diferentes maneiras
para localizar o mesmo
documento, sem limite físico.
Recuperação
Exemplo de fácil consulta:
ir até a sala do arquivo,
encontrar o documento
removê-lo, ir à copiadora,
fazer a cópia, retornar o
original ao local de origem.
Ir ao computador, pesquisar
pelo índice desejado,
visualizar ou imprimir
Tempo de recuperação
Desde vários minutos até
semanas.
Segundos.
Distribuição do documento
(imagem)
Malote, correio interno.
via mensagem eletrônica,
própria do sistema ou e-mail.
Espaço exigido para
armazenamento (documentos
por m³)
Alguns milhares Milhões
Potencial de perda de
documentos
Alta Mínima
Impacto na infra-estrutura de
computadores
Nenhum Alto
Impacto no sistema
atualmente em uso
Nenhum
Potencialmente Alto – pode
requerer revisão de processos
Tabela 1 - Comparação entre atividades de recuperação de documentos em papel e GED.
Page 79
hidden
9
6.8.2 Ambiente típico
Embora um ambiente de GED possa ter configurações totalmente variadas, dependendo
da aplicação desejada, a Figura 14 mostra um sistema com componentes típicos.
figura 14 - Componentes típicos de um ambiente de GED
• documento: pode estar em papel ou nativamente digital.
• scanner: equipamento utilizado para digitalizar o documento, ou seja, obter uma
imagem do documento e ser armazenada eletronicamente.
• Processador: normalmente os sistemas GED são instalados em um ou mais
computadores, normalmente servidores, em rede para facilitar a distribuição de
informação.
• rede: meio de comunicação entre os diversos componentes do sistema.
• armazenamento: pode ser no próprio servidor de imagens ou outro ambiente
computacional.
• Impressora: sempre utilizada quando da necessidade de obtenção de uma cópia física
do documento.
• Estação de trabalho: computador para acesso ao servidor que pode permitir consultar,
criar novos documentos, cadastrar documentos existentes, etc.
Page 80
hidden
80
6.8.3 sistemas ged
Segundo o CENADEM, o conjunto de programas que administram um ambiente GED
pode ser considerado um sistema.
Para resolver seu problema, você vai precisar de mais de um software para ter uma solução
completa. Por exemplo, pode precisar de um software especial para controlar a digitalização,
outro para o cadastro em lote de documentos, outro gerenciando a impressão, programa de
gerenciamento de backup, além, é claro, do software que gerencia o documento propriamente dito.
Um software de GED dificilmente possui todas estas funções, mesmo porque em separado elas
dão melhor resultado e permitem que você integre as melhores soluções para seu problema.
Existe no mercado um número significativo de empresas fornecedoras, o que às vezes
pode dificultar a seleção. Somente na feira promovida anualmente pela AIIM, mais de 350
expositores apresentam suas soluções. O usuário fica meio confuso sobre o que adquirir e se
realmente suas expectativas serão atendidas. Mesmo porque, existe uma natural tendência de o
fornecedor adaptar sua solução para que se resolva o problema do cliente, podendo por vezes
descaracterizar o produto, levando a um custo de customização elevado e outro de manutenção
futura muito grande.
A dúvida normalmente mais contundente não é o que esse ou aquele software faz, ma
saber o que realmente é necessário no seu ambiente de GED que irá atender às necessidades dos
usuários a um custo realizável.
6.8.4 Alguns equipamentos comuns em sistemas de ged
• Dispositivos de entrada de imagens: scanner, câmera fotográfica digital, filmadora
digital, fax, e-mail.
• Dispositivos de armazenamento de documentos digitais: magnético (discos e fitas),
ópticos (CD, DvD, WORM, magneto-óptico), jukebox, disk array, etc.
• Dispositivos de saída e visualização: monitor de vídeo, impressora, fax, plotter.
• Configurações de rede: lAN, WAN, Intranet, Internet, Extranet.
Page 82
hidden
82
em papel que foram digitalizados (escanerizados).
• Procura-se de preferência formar índices de consulta no banco de dados, coerentes
com o “Plano de Arquivo” para esses documentos, o que normalmente leva a poucos
índices, facilitando o cadastro de muitos documentos.
Como normalmente nos sistemas de Document Imaging circulam grandes somas de dinheiro
(grande número de licenças, muito serviço de digitalização e cadastro, muito equipamento), você
pode encontrar em feiras sempre uma grande quantidade deste tipo de produto.
Embora a princípio possa parecer pouca coisa criar um “Arquivo Eletrônico”, isso já
representa uma enorme ferramenta de racionalização de trabalho de busca de documentos.
virtualmente é como se o usuário tivesse em sua mesa, entende-se computador, todo o arquivo
da empresa, independente do fato de o arquivo possuir 30 milhões de documentos.
Além disso, todas as boas ferramentas de GED do mercado são customizáveis e
programáveis, fazendo com que você possa integrar essas informações de documentos a outros
processos e programas em uso dentro da empresa.
7.3 Document Management
Sob o ponto de vista do “Ciclo de vida” de um documento, o Document Management
permite que você controle seu documento desde o momento de sua criação até seu respectivo
descarte.
O objetivo não é somente controlar seu “Arquivo Ativo”, mas controlar também os
documentos que ficam sobre sua mesa, em seus processos em andamento, no seu computador,
etc., ou seja, todo documento que esteja em uso, sendo modificado, sendo referenciado por outros
documentos, etc., passará a compor o dia-a-dia de seu trabalho.
Tende a apresentar um retorno de investimento mais rápido, pois os usuários passam a ter
benefícios do uso a todo o momento do seu trabalho, e não somente no momento em que precisar
de um documento que está no arquivo. Isso em geral leva à maior percepção dos benefícios da
implantação por parte dos colaboradores.
É uma maneira interessante de racionalizar trabalho e aumentar a produtividade da
Page 83
hidden
8
equipe.
São sistemas, via de regra, de interface com um maior nível de complexidade e
normalmente implicam em um maior investimento unitário por documento gerenciado. Não
podemos, no entanto, generalizar a comparação direta de custos de implantação, pois normalmente
se trabalha em Document Management com número menor de documentos e grupos de trabalho
mais restritos, o que levará a custos totais normalmente menores de implantação.
Não existe uma regra que defina claramente o que será mais barato instalar, um Document
Imaging ou um Document Management. Depende de cada caso estudado.
7.4 EDMS (Engineering Document Management System)
Um Sistema de Gerenciamento de Documentos Técnicos é aplicável, como o próprio nome
já diz, a documentos técnicos: plantas, desenhos, especificações, relatórios, listas de materiais,
normas de qualidade, etc.
Essencialmente o cerne de um EDMS é um sistema de Document Management, mas
normalmente apresenta características especiais como:
• Manipular desenhos de grandes dimensões, às vezes com mais de dois metros de
comprimento.
• Possuir recursos de comparar versões de documentos CAD.
• visualizar arquivos híbridos (CAD + Raster).
• visualização e impressão de CAD com mais recursos.
• Fazer referências entre diferentes documentos.
• Criar remessas de documentos para serem enviadas a empreiteiras ou outras empresas
que manipulam projetos.
São sistemas de uso mais restrito ao pessoal que trabalha diretamente com este tipo de
documento e normalmente só eles entendem a extensão e profundidade da real necessidade
destes itens anteriormente citados.
Se tiver que implantar um sistema para esse tipo documental, certifique-se que o sistema
foi nativamente concebido para EDMS.
Page 89
hidden
89
• Documentos relacionados a uma licitação.
• Documentos de um projeto.
• Conjunto de jurisprudências.
• Catálogo de fotos e currículos.
• Digitalização de um grupo específico de documento de uso comum.
• Catálogo de normas.
• Conjunto de manuais de uma planta ou equipamento.
7.9.3 integração com sistemas legados
Alguns programas possuem módulos especiais que com pouco esforço de customização
(sem programação direta) permitem a integração com outros ambientes da empresa. O fato de
não exigir programação faz com que integrações que pareciam dificílimas passem a ter uma
instalação fácil, rápida e barata.
figura 15 - Integração de sistemas GED com mainframe
Page 90
hidden
90
O exemplo a seguir mostra a integração de um GED com um sistema rodando em
mainframe. Observe que ao clicar na tela do emulador de mainframe o número do documento,
automaticamente ele passa a ser pesquisado na base do GED e o documento é apresentado na
tela.
7.9.4 conversão de formatos de arquivos
Existem correntes de pensamento que consideram adequado converter toda a base
documental ou parte significativa dela em um formato comum, evitando assim múltiplos
visualizadores e tendo maior tendência à perpetuação do documento digital.
Os formatos mais procurados para a conversão final de documentos são o TIF e o PDF.
Alguns softwares possuem conversores que permitem converter outros tipos de extensão
e documentos universais (DOC, xlS, DWG) nos formatos base. A conversão pode ser em lote ou
usando “impressoras virtuais”, similares às que o Adobe Acrobat utiliza para imprimir qualquer
tipo documental em formato PDF.
7.9.5 Formulários para criação de novos documentos
Existem algumas formas de automatizar a criação de documentos. Uma das maneiras mais
interessantes é por meio de formulários eletrônicos. Os métodos mais conhecidos e disseminados
utilizam arquivos PDF, HTMl (HyperText Markup Language) e o xMl (eXtensible Markup
Language). A escolha de cada uma das tecnologias depende do seu caso. O uso do PDF tem sido
muito disseminado. O HTMl permite visualização e preenchimento facilitado como páginas
WEB. O xMl permite criar documentos “com inteligência”. Claro que existem outras ferramentas
e fornecedores que apresentam soluções que se adaptam ao seu caso de formulário eletrônico.
O uso do xMl tem recebido boa acolhida por partes das empresas. Usando um formulário
preparado em xMl, podemos ter alguns campos do documento preenchidos automaticamente
e outros parcialmente preenchidos pela combinação de dados obtidos em bancos de dados
Page 93
hidden
9
vários tipos: bancos de dados, arquivos de PlC, relatórios de mainframe, etc.
7.10.1 Visualizadores
quando se pensa em variedade de extensões (tipos) de arquivos, o primeiro problema que
enfrentamos é se o GED em questão possui ou não visualizador para o documento em questão.
As questões-chave são:
• O visualizador de meus GED visualiza este tipo de documento?
• Se visualizar, é com todos os detalhes reais ou apresenta deficiências de visualização?
Por exemplo, às vezes um visualizador de .doc não consegue mostrar as imagens que
o documento possui, distroce as tabelas, não mostra os diferentes cabeçalhos, etc.
• Esse visualizador consegue ver todas as versões deste tipo de documento? É comum
serem lançadas novas versões do programa e por vezes você não teve chance
de atualizar o visualizador do seu GED, ou seu fornecedor ainda não produziu a
visualização respectiva.
Conforme já foi comentado em texto anterior neste trabalho, é comum um ambiente de
GED ter vários visualizadores conjugados, e dependendo do arquivo do qual você solicitar a
visualização, pode ser chamado um ou outro visualizador. Isto é normalmente transparente ao
usuário, ou seja, ele simplesmente indica que quer ver o documento e o programa se incumbe
de carregar o visualizador adequado.
Às vezes é necessário comprar visualizadores externos, pois os bons visualizadores para
arquivos especiais nem sempre são gratuitos.
Page 94
hidden
9
7.10.2 impressão e Plotagem
As mesmas considerações sobre a visualização são aplicáveis à impressão. É muito
comum os visualizadores permitirem a impressão desses arquivos, mas nem sempre com a
mesma perfeição do programa que os originou. Normalmente não há problema com impressão
de arquivos .tif de documentos de tamanho carta, mas pode ser que você precise de recursos
adicionais para imprimir, por exemplo, desenhos de CAD.
Page 95
hidden
9
8 outros sistemas auxiliados pelo ged
Conforme já explorado ao longo desta dissertação, a finalidade do GED é auxiliar na
organização eletrônica de documentos, que são na maioria dos casos informações não estruturadas.
Partindo do princípio que os documentos sempre existirão em um ou outro contexto, seja para
um relatório, artigo, comunicado, ou outra aplicação qualquer, sempre que precisar-se gerenciá-
los. O GED é uma ferramenta excelente para o gerenciamento informações não estruturadas, ou
seja, informação que não pode ser armazenada em um banco de dados.
Um estudo feito pelo Gartner Goup sob encomenda da AIIM em 2001 e publicado na
feira de GED neste mesmo ano mostra claramente o que já estávamos sentindo no mercado. É
muito difícil que uma única tecnologia de informação supra toda a necessidade de informação
de que uma empresa necessita. logo, uma série de ferramentas é necessário, de acordo com o
contexto de informação desejada.
As ferramentas mais comuns empregadas nas empresas são:
• ERP;
• CRM;
• e-Business;
• Knowledge Management;
• Ferramentas de Groupware (Workgroup e Workflow);
• Records Management / Record and Information Management (RM/RIM);
• Content Management / Enterprise Content Management (CM/ECM);]
• Product Data Management (PDM);
• Enterprise Application Integration (EAI).
Page 96
hidden
9
8.1 ERP (Enterprise Resource Planning)
São os chamados Sistemas Integrados de Gestão. Oriundos do MRP (Material Resource
Planning), acabaram por integrar uma quantidade maior de informações e abraçar uma série
de outros departamentos da empresa, abrangendo recursos humanos, financeiro, contábil,
faturamento, vendas, distribuição, controladoria, etc.
O princípio básico é que vários setores da empresa podem precisar das mesmas
informações, como, por exemplo, a venda de um produto gera um pedido à fábrica que, por sua
vez, pode gerar ordens de produção, que podem ativar o estoque para checar quantitativos, que
podem gerar ordens de compra de matérias-primas, avisos de chegada de material, faturamento,
etc.
Estando em uma base central, fica mais fácil usar esses dados, evitar retrabalhos, fazer
inferência de dados e possibilitar ter uma visão mais holística do gerenciamento do negócio e
suas inter-relações. A Figura 16 representa um modelo simplificado de um sistema de ERP:
figura 16 - Um modelo simplificado de ERP
No início do uso intensivo de sistemas ERP, muito tinham a idéia fixa que seria possível
gerenciar toda e qualquer informação relevante à gestão da empresa utilizando-o. Embora o ERP
tenha um potencial enorme e traga consigo grandes vantagens do ponto de vista administrativo, na
realidade é bem difícil de implantar todos os módulos e customizar de acordo com sua empresa
Page 99
hidden
99
e não-documentado, para frisar que alguns conhecimentos poderiam ser facilmente
explicitados. Por exemplo: não está escrito em nenhum lugar o roteiro de como sair
do lugar de onde você está lendo este trabalho até sua casa ou escritório. Mas esta
informação poderia ser escrita (explicitada).
• Tácito: é algo pessoal, formado dentro de um contexto social e individual, não é
propriedade de nenhuma organização ou de uma coletividade e não consegue ser
explicitado. Por exemplo: nem mesmo o Pelé como treinador de futebol de minha
equipe, ele não conseguirá transformar todos em “clones de Pelé”, pois a maior parte
de seu talento se deve a características pessoais dele que mesmo querendo ele não irá
conseguir transmitir e tem inclusive a ver com o meio social em que ele se formou.
Esta metodologia de usar diversas ferramentas para ajudar a atingir um objetivo de
gerenciamento de conhecimento específico. Não quer dizer que estas ferramentas sejam recursos
de informática. Às vezes podemos inclusive não ter nenhum computador, papel ou outro recurso
físico envolvido diretamente e ainda assim podemos fazer Gerenciamento do Conhecimento.
A princípio, qualquer ferramenta que permita que o conhecimento possa ser criado,
adquirido, organizado, compartilhado ou aplicado, pode contribuir com o seu Knowledge
Management. Dificilmente uma ferramenta isolada fará isso. você deve analisar com bom senso e
ajuda especializada que ferramenta poderia ser útil à sua situação. Exemplos de ferramentas que
podem ser usadas para auxiliar seu Knowledge Management: Balanced Scorecard, Benchmarking,
Brainstorm, Groupware (workgroup e workflow), ERP, GED, CRM, Data Mining, Inteligência
Competitiva, Internet, agentes inteligentes, Data Warehousing, etc.
8.5 Ferramentas de Groupware (Workgroup e Workflow)
Creio que as definições de Cruz (2001) deixam bem claro o que são essas ferramentas:
• Groupware: é um conjunto de ferramentas que tem por finalidade aumentar a
produtividade do trabalho cooperativo. É todo e qualquer sistema computadorizado
que permita a grupos de pessoas trabalhar de forma cooperativa a fim de atingir um
objetivo comum, aumentando a produtividade.
Page 100
hidden
100
• Workgroup: qualquer tecnologia que permita a grupos de pessoas compartilhar
informações a fim de realizar suas atividades, aumentando a produtividade e eficiência.
Para conseguir isso, os usuários têm de ir até a informação que necessitam processar.
Por isso o workgroup é, por concepção, estático.
• Workflow: ferramenta que tem por finalidade automatizar processos, racionalizando-
os e, conseqüentemente, aumentando a produtividade por meio de dois componentes
implícitos: organização e tecnologia. Workflow, do inglês Fluxo de Trabalho, faz a
informação necessária para cada atividade percorrer o processo previamente mapeado.
Workflow é essencialmente dinâmico.
8.6 Records Management/Record and Information Management
(RM/RIM)
O objetivo deste grupo de processos/metodologias/tecnologias é gerenciar informações
independente da mídia em que elas se encontram, sejam físico ou digital.
A necessidade de gerenciar mídias físicas ocorre por vários motivos, entre eles:
• Conforme já intensivamente discutido, para documentos com baixo nível de consulta,
seria um custo desnecessário digitalizar todo o acervo, que não implicaria em Retorno
de Investimento favorável;
• Uma quantidade significativa de documentos deve ser armazenada para fins legais e
outros por motivos históricos;
• Certos documentos não podem ser digitalizados por motivos de Copyright;
• Fitas de vídeo, som, CDs com grandes volumes de informação ficam complicados de
ser armazenados em único documento digital e por vezes não há sentido em fazê-lo.
Não é só ferramenta de TI, pois envolve o gerenciamento das informações físicas, ou
seja, papéis, fitas de vídeo, fotos, microformas em geral, livros, etc., porém, como qualquer outra
área em que grandes volumes de informação precisam ser manipulados, o uso de informática é
intenso para a localização e recuperação de informações.
Percebe-se que a amplitude do RM torna-o fortemente envolvido com as diversas

Sign up today - FREE

Mendeley saves you time finding and organizing research. Learn more

  • All your research in one place
  • Add and import papers easily
  • Access it anywhere, anytime

Start using Mendeley in seconds!

Already have an account? Sign in

Readership Statistics

1 Reader on Mendeley
by Discipline
 
by Academic Status
 
100% Professor
by Country
 
100% Brazil