Open Source Document Management: OpenKM

OpenKM è la soluzione open source per la Gestione Documentale prodotta da GIT Cunsultors S.L. Il prodotto è offerto in due edizioni:

  • Community Edition: edizione liberamente utilizzabile sotto licenza GPL 2. E’ fornita as is, senza alcun tipo di supporto o garanzia se non quella della community degli utenti.
  • Enterprise Edition: versione a pagamento (prezzo in base al numero di utenti) per cui è garantito il supporto su base annua rinnovabile. Alcune delle funzionalità di OpenKM sono presenti solo in questa edizione.

L’elenco completo delle differenze in termini di funzionalità è reperibile a questo indirizzo:

http://www.openkm.com/Compare-editions.html

La versione Community che ho testato è la 3.0, rilasciata il 25 Novembre 2008. Essendo basato su tecnologia Java, l’installazione ed il funzionamento sono possibili su svariate piattaforme: Linux, Windows, e Mac.
Le funzionalità principali (quelle in corsivo sono disponibili esclusivamente sulla Enterprise Edition) sono:
Server

  • Java 1.5 o successivo
  • JBoss Application server 4.2.x
  • GNU/Linux, Unix, MacOs, Windows 2000, Windows XP, Windows
    2003
  • Repository salvato su file system, MySQL, PostgreSQL, Oracle,
    etc.
  • Integrazione con altri software via WebServices

Client

  • Web-based client: accesso ai documenti da qualsiasi luogo
  • Interfaccia AJAX
  • Supporto dei principali browser: Firefox 1.5 o successivo,
    IExplorer 5.5 o successivo, Opera e Safari
  • Localizzazione in italiano disponibile
  • Non richiede l’installazione di client aggiuntivi
  • Preview dei file multimediali
  • Supporto a WebDAV

Document management

  • Upload multiplo di documenti zippati
  • Download di cartelle del repository in formato ZIP
  • Lock / Unlock dei documenti
  • Amministrazione dei preferiti
  • Supporto per template documenti
  • Cestino per l’archiviazione dei contenuti cancellati
  • Notifiche via mail per la modifica dei documenti
  • Link univoco per i singoli documenti
  • Note sui documenti

OCR

  • Supporto per file binari, immagini in B/N o a colori
  • Riconjoscimento delle principali lingue, tra cui
    l’Italiano

Versioning

  • Check-in / check-out
  • Supporto ai commenti alle singole versionsi
  • Accesso alle versioni precedenti di un documento
  • Restore delle versioni precedenti di un documento
  • Compressione della history dei documenti per risparmiare
    spazio

Property Groups (metadata)

  • Possibilità di inserimento di meta-dati
    personalizzati
  • Formati dati per I meta-data: input, simple list, multiple select list, textarea
  • Internazionalizzazione dei meta-tag

Sicurezza

  • Plug-in per l’autenticazione basata su JAAS
  • Supporto per LDAP, Active Directory, Database, …
  • Supporto del modello utenti / ruoli
  • Permessi per documenti e cartelle
  • Memorizzazione delle attività utente
  • Supporto a comunicazione basate su SSL

Dashboard

  • Viste utente personalizzate
  • News utente (agenti di ricerca)
  • Viste sui workflow

Ricerca

  • Ricerche per contenuto, keywords, data di modifica, autore e
    tipo di documento
  • Indicizzazione automatica dei docuemnti: Testo, HTML, RTF, XML,
    PDF, OpenOffice.org, MS Office, MS Office 2007, JPEG EXIF, MP3
    ID3
  • Ricerca per sinonimo
  • Ordinamento per rilevanza dei risultati
  • Salvataggio delle ricerche frequenti
  • Ricerca avanzata con XPath o SQL

Amministrazione

  • Unlock / Cancel checkout
  • Vista raw del repository
  • Logging delle attività utente
  • Import dei documenti / cartelle dal filesystem
  • Esportazione del repository sul filesystem
  • Supporto alla libreria JasperReport

I punti a favore di questa piattaforma sono:

  • Adozione di standard e formati aperti
  • Integrazione con Active Directory
  • Supporto dei più comuni DBMS (MySql, PostgreSQL, MS-SQL, Oracle, …)
  • Semplicità

Gli aspetti più problematici (almeno per le mie esigenze):

  • Mancanza di alcune funzioni importanti nell’edizione Community
  • Impossibilità di accedere ai contenuti via File System o FTP

Alcuni screenshot:

Finestra principale

Finestra principale


Proprietà di un documento

Proprietà di un documento


Versioning dei documenti

Versioning dei documenti


Ricerca dei documenti

Ricerca dei documenti

Open Source Document Management: Nuxeo

Continuiamo e concludiamo la carrellata di soluzioni open source dedicate al document management, parlando di Nuxeo 5, la soluzione offerta da Nuxeo SAS e sviluppata insieme ad una community di sviluppatori e contributor.
Come i prodotti precedentemente presentati, si basa sulle ultime tecnologie Java, tra cui: Apache Jackrabbit JCR, JBoss application server, JBoss Seam, jBPM, JBoss Rules, JSF, EJB3, ed altre ancora.

Nuxeo SAS offre anche un’edizione a pagamento con supporto dedicato e certificazione.
Nuxeo 5 è altresì disponibile in due edizioni che condividono diversi componenti ma che sono indirizzate a target differenti:

  • Nuxeo Enterprise Platform (EP): è una piattaforma server-side per la creazione di applicazioni ECM di grande entità (ad esempio: grossi archivi documentali, soluzioni di
    collaborazioni corporate, etc)
  • Nuxeo Rich Client Platform (RCP): è un framework, basato su Eclipse RCP e Microsoft Office, per la creazione di rich client application specializzate nella gestione documentale e nella
    collaborazione.

Le aree verso cui Nuxeo 5 si indirizza sono:

  1. Document Management
  2. Digital Assets Management
  3. Collaborazione
  4. Compliance
  5. Records Management
  6. Business Process Management
  7. Business Rules
  8. Retention Management
  9. Indexing e ricerca
  10. File Transformation automatica

Alcune delle funzionalità principali:

Document management e collaborazione

  • Supporto di workspace di documenti condivisi (i workspace sono uno strumento per la collaborazione di utenti con ruoli diverso che devono lavorare su un medesimo progetto)
  • Versioning flessibile e configurabile
  • Gestione File multidimensionale per l’organizzazione di contenuti su diversi assi
  • Document Life Cycle Management
  • Commenti, notifiche on-demand, e altri strumenti di collaborazione
  • Strumenti di ricerca avanzata all’interno del repository
  • Strumenti di reporting / business intelligence direttamente dal repository
  • Unique Identifier Generator per la creazione di UID significativi associati ai documenti

Business Process Management

  • Publishing: pubblicazione dei documenti in molteplici aree contemporaneamente.
  • Collaborative Review: revisione dei documenti da parte di molteplici utenti preassegnato o scelti direttamente dall’autore
  • Approval Review: possibilità di configurare catene seriali di approvazione

Transformation Service

  • Trasformazione automatica dei contenuti che soddisfano una o più regole
  • Trasformazione manuale dei contenuti
  • Espandibilità delle conversioni via plugin

Retention Service

  • Supporto di molteplici operazioni sui contenuti avviabili automaticamente sulla base di regole definite
    dall’utente
  • Espandibilità delle operazioni via plugin

Audit Trail

  • Logging avanzato delle attività utenti
  • Notifiche automatiche multi piattaforma (email, SMS, …)
  • Estrazioni di audit report

I vantaggi riscontrati sono:

  • Adozione di standard e formati aperti
  • Completezza
  • Integrazione con Active Directory
  • Supporto dei più comuni DBMS (MySql, PostgreSQL, MS-SQL, Oracle, …)
  • Drag & drop dei documenti sul browser
  • Integrazione con MS Office
  • Documentazione completa

Le “magagne” invece:

  • Complessità
  • Impossibilità di accedere ai contenuti via File System o FTP

Alcuni screenshot

Default workspace

Default workspace


Proprietà di un documento

Proprietà di un documento


Ricerca

Ricerca


Creazione di workflow

Creazione di workflow

Open Source Document Management: Alfresco

In questi giorni sto testando alcuni prodotti per il Document Management, per i quali vorrei darvi le mie impressioni. Il primo, e forse il più conosciuto, è Alfresco.
Alfresco è una soluzione completa di Enterprise Content Management fondata nel 2005 da John Newton (cofondatore di Documentum) e John Powell (COO di Business Objects). Basata interamente su tecnologie open source e standard aperti, vanta clienti come Electronic Arts, Activision, Fox e molti altri.

Alfresco viene offerto in due versioni:

  • Enterprise Edition: edizione stabile, certificata e con supporto dedicato (a pagamento). Pensata per aziende, organi governativi e tutte quelle realtà in cui è necessario avere uno SLA. EE è scaricabile e valutabile per un periodo di 30 giorni.
  • Community Labs: edizione non certificata e supportata esclusivamente dalla community di Alfresco. Distribuita con licenza GPL 2 (con linking exception) è liberamente scaricabile ed utilizzabile.

Per maggiori informazioni sulle differenze tra le due edizioni, si rimanda a:

http://www.alfresco.com/it/products/networks/compare/

La versione Community Labs che ho installato è la 3.0 Final, rilasciata il 19 Gennaio 2009.
Basato su tecnologie Java, l’installazione ed il funzionamento sono possibili su svariate piattaforme: Linux, Windows, Mac.

Le funzionalità di Alfresco si articolano su queste aree:

  1. Document Management
  2. Web Content Management
  3. Collaboration
  4. Content Platform and Repository
  5. Content Management Interoperability Services (CMIS)
  6. Records Management
  7. Image Management

Tra le funzionalità principali:

Document Management

Check-In/Out dei documenti e Version Control

  • Simple Library Services – Check-Out del documento per prevenire la modifica contemporanea da parte di più utenti
  • Version Control – Minor e major version control

Disco condiviso

  • Tutti i contenuti sono disponibili attraverso un’unità condivisa
  • Utilizzo di qualsiasi prodotto di authoring, senza bisogno di installare pacchetti o plugin
  • Funzionalità di salvataggio, versioning, condivisione, ricerca e auditing

Integrazione con Microsoft Office

OpenSearch

  • Sistema di ricerca in stile Amazon o Google
  • Possibilità di ricerca su multipli repository Alfresco oltre ad eventuali fonti esterne (wiki, feed RSS, blog, …)

Social tagging

  • Tagging dei contenuti e ricerca basata sui tag

Integrazione con portali esistenti

  • Integrazione basata su standard JSR-168 e REST

Accesso ai contenuti anche via CIFS, WebDAV ed FTP

Sicurezza

  • Gestione accessi e privilegi a utenti e gruppi
  • Controlli di sicurezza fino a livello del singolo documento
  • Single sign-on attraverso NTLM o LDAP
  • Supporto ad Active Directory

Gestione automatizzata di workflow e ciclo vita dei documenti

  • Integrazione con jBPM
  • Gestione dei contenuti con controllo della creazione, review, approvazione, eventuale validità, retention ed archiviazione

Data management and Transformation Engine

  • Servizi di trasformazione automatica: da Office a ODF/PDF, da PowerPoint a Flash

Web Content Management

Oltre alle funzionalità elencate nella sezione precedente:

Sandbox, visualizzazione e virtualizzazione

  • Anteprima delle modifiche a qualsiasi pagina o applicazione Web
  • Virtualizzazione delle modifiche su un siti e pagine web

Architettura REST

  • L’interfaccia URL consente l’assemblaggio semplice e rapido degli oggetti Alfresco, e di altre applicazioni Web, attraverso varie tecnologie

Creazione di modelli e rami per siti Web

  • Creazione rapida di nuovi siti da modelli esistenti e possibilità di organizzare i principali aggiornamenti dei siti ramificando il sito esistente

Editoria XML e pubblicazione multicanale

  • Editoria di moduli utilizzando schemi XML standard
  • Visualizzazione automatica dell’interfaccia utente, basata sullo standard XForms
  • Creazione automatica di vari formati per una molteplici canali: web, mobile, …

Collaboration

Oltre alle funzionalità elencate nelle sezioni precedenti:

Creazione di strumenti di collaborazione

  • Blog, wiki, portali di progetto, …

Document library

  • Upload multiplo dei documenti sui portali di collaborazione
  • Visualizzazione dei contenuti via web, grazie a Flash
  • Ricerca dei contenuti e dei relativi meta-dati, tag e proprietà
  • Accesso ai contenuti via feed RSS

Attività

  • Tracking degli aggiornamenti di ogni progetto: contenuti nuovo o aggiornati, commenti, nuovi membri del team e date o milestone critiche

Supporto al protocollo SharePoint

Dopo qualche giorno di utilizzo, questi i punti di forza riscontrati:

  • Estrema flessibilità e completezza
  • Adozione di standard e formati aperti
  • Integrazione con Active Directory
  • Molteplici possibilità di accesso ai contenuti: WebDAV, CIFS, FTP, …
  • Supporto dei più comuni DBMS (MySql, PostgreSQL, MS-SQL, Oracle, …)

…e queste invece alcune difficoltà riscontrate:

  • Complessità e curva di apprendimento ripida
  • Difficoltà di manutenzione
  • Documentazione non sempre aggiornata

Alcuni screenshot:

Repository Alfresco montato come disco di rete

Repository Alfresco montato come disco di rete


Repository Alfresco con interfaccia web

Repository Alfresco con interfaccia web


Alfresco Share: creazione di strumenti di collaborazione (wiki, portali, blog, ...)

Alfresco Share: creazione di strumenti di collaborazione (wiki, portali, blog, ...)


Proprietà di un documento

Proprietà di un documento