Dokument Management und revisionssichere Archivierung mit Microsoft SharePoint
Einführung
Microsoft SharePoint hat sich bei vielen Unternehmen als Basistechnologie für verschiedene Bereiche wie Intranet, Team-und Arbeitsräume, sowie für dokument-basierte Zusammenarbeit etabliert. Der Schritt zu einem Dokument Management System mit Archivierung ist aber nicht trivial.
Der Begriff Archivierung wird in Projektalltag häufig leichtfertig verwendet, oft analog zu Begriffen wie
- „Auslagerung“ – oft getrieben durch die IT, um das Datenvolumen in SharePoint und den SQL Datenbanken zu reduzieren
- „Wegspeichern“ – oft durch Anwender gewünscht, um Dateien für einen längeren Zeitraum aufzubewahren, damit diese nicht aus Versehen gelöscht werden
In diesem Beitrag geht es um revisionssichere Archivierung, aber was bedeutet das eigentlich? Vereinfacht gesagt gilt:
Die Ausdrücke „relevante Dokumente“ und „ordnungsgemäß“ haben es allerdings in sich. Es gibt kein Gesetz oder eine allgemeingültige Richtlinie, die genau beschreibt, welche Dokumente wie aufbewahrt werden müssen. Stattdessen gibt es Grundsätze der Revisionssicherheit, diese sind in Deutschland z.B. für steuerrechtlich und handelsrechtlich relevante Dokumente erforderlich und unter anderem im Handelsgesetzbuch, in der Abgabenordnung, in der GoBS oder der GoBD definiert. Merkmale der Revisionssicherheit sind unter anderem:
- Vollständigkeit
- Schutz vor Veränderung, Verfälschung und Verlust
- Einhaltung der Aufbewahrungsfristen
- Zugriff und Lesbarkeit der Informationen
- Prüfbarkeit
Ich möchte im Folgenden auf typische Fragen eingehen, die im Rahmen der Implementierung einer revisionssicheren Lösung zu beachten sind.
Ist SharePoint eigentlich revisionssicher?
Für die Beantwortung der Frage ist es unerheblich ob MOSS 2007, SharePoint 2010, SharePoint 2013 oder SharePoint 2016 oder SharePoint Online, OneDrive for Business, etc. eingesetzt werden – die Antwort ist immer die gleiche: kein Produkt ist von Haus aus revisionssicher! Eine Gesamtlösung, bestehend aus einem technischen Produkt und organisatorischen Prozessen, kann bei richtiger Nutzung revisionssicher sein. Oder kurz gesagt:
Häufig wird bei derartigen DMS-Projekten die technische Lösung in den Vordergrund gestellt. Die Kernfragen rund um die revisionssichere Archivierung sind aber technik-unabhängig. Es ist ratsam, zu prüfen, ob im Unternehmen bereits anderweitige Archivierungslösungen existieren, da dann ggf. grundlegende Prozessfragen bereits geklärt sind:
Welche Dokumente sind zu archivieren?
Der Grund für die revisionssichere Archivierung von Dokumenten sind Aufbewahrungspflichten. Vereinfacht kann man sagen:
Aber wer definiert, welche Dokumente aufbewahrt werden müssen? Und wie lange? Und ab wann beginnt die Aufbewahrungsdauer eigentlich?
Die Anforderung zur Aufbewahrung von Dokumenten kann verschiedenen Quellen haben:
Gesetzliche Vorgaben (legal compliance)
Der Gesetzgeber in Deutschland spricht nicht von einer Archivierungspflicht, sondern von einer Aufbewahrungspflicht. Die Aufbewahrungspflichten sind in unterschiedlichen Gesetzen geregelt, z.B.:
- steuerrechtlich relevante Dokumente sind gemäß der Abgabenordnung (AO) aufzubewahren
- Handelsrechtlich relevante Dokumente sind gemäß dem Handelsgesetzbuch (HGB) aufzubewahren
- Produkthaftungs-relevante Dokumente sind gemäß dem Produkthaftungsgesetz (ProdHaftG) aufzubewahren
- …
Unternehmensrichtlinien (corporate compliance)
Zusätzlich zu den gesetzlichen Anforderungen kann ein Unternehmen weitere Anforderungen an die Aufbewahrung von Dokumenten definieren, z.B.:
- Aufbewahrung von Dokumenten über die gesetzliche Aufbewahrungsdauer hinaus
- Aufbewahrung zusätzlicher Dokumente, für die keine gesetzliche Aufbewahrungsdauer gilt
Bei dem Design einer revisionssicheren Archivierungslösung auf Basis SharePoint ist auch der Gesamtkontext zu definieren, für den die neue Lösung eingesetzt werden soll, z.B.:
- Sollen nur Dokumente in SharePoint, oder auch SharePoint Online / Office 365 archiviert werden?
- Sollen andere Systeme wie z.B. Fileserver abgelöst werden?
- Sollen Posteingangs- und Postausgangsdokumente digitalisiert und archiviert werden?
- Sollen physikalische Aktenarchive (Aktenordner) digitalisiert und archiviert werden?
Wie soll archiviert werden?
Nach der Klärung, welche Dokumente einer Aufbewahrungspflicht unterliegen und damit archiviert werden müssen ist zu definieren, wie die Archivierung konkret erfolgen soll.
Wie konkret zu archivieren ist, ist jedem Unternehmen selber überlassen, solange es ordnungsgemäß ist.
Der Verband Organisations- und Informationssysteme e. V. hat dazu zehn Merksätze mit Erläuterungen zum Thema elektronische Archivierung erarbeitet:
- Jedes Dokument muss nach Maßgabe der rechtlichen und organisationsinternen Anforderungen ordnungsgemäß aufbewahrt werden
- Die Archivierung hat vollständig zu erfolgen – kein Dokument darf auf dem Weg ins Archiv oder im Archiv selbst verloren gehen
- Jedes Dokument ist zum organisatorisch frühestmöglichen Zeitpunkt zu archivieren
- Jedes Dokument muss mit seinem Original übereinstimmen und unveränderbar archiviert werden
- Jedes Dokument darf nur von entsprechend berechtigten Benutzern eingesehen werden
- Jedes Dokument muss in angemessener Zeit wiedergefunden und reproduziert werden können
- Jedes Dokument darf frühestens nach Ablauf seiner Aufbewahrungsfrist vernichtet, d.h. aus dem Archiv gelöscht werden
- Jede ändernde Aktion im elektronischen Archivsystem muss für Berechtigte nachvollziehbar protokolliert werden
- Das gesamte organisatorische und technische Verfahren der Archivierung kann von einem sachverständigen Dritten jederzeit geprüft werden
- Bei allen Migrationen und Änderungen am Archivsystem muss die Einhaltung aller zuvor aufgeführten Grundsätze sichergestellt sein
Das komplette PDF mit weiteren Erläuterungen kann auf der Homepage des Verbands Organisations- und Informationssysteme e. V. heruntergeladen werden.
Diese Merksätze sind sehr allgemein gehalten und geben nur an, was zu tun ist, aber nicht, wie dies konkret zu tun ist. Daher müssen diese Merksätze unternehmensspezifisch, d.h. passend zu der organisatorischen Struktur des Unternehmens und der technischen Möglichkeiten, umgesetzt werden.
Folgende Fragen helfen zu definieren, wie die Archivierung konkret erfolgen soll:
- Welches Speichermedium soll / darf verwendet werden, z.B. Datenbank, spezielle Speichersysteme verschiedener Hersteller, ggf. WORM (write once read many)?
- Soll das (digitalisierte) Originaldokument alleine archiviert werden, oder ist eine Dateikonvertierung nötig, um die Lesbarkeit sicherzustellen?
- Im Falle einer Dateikonvertierung
- In welches Dateiformat soll konvertiert werden?
- soll diese Datei zusätzlich oder ausschließlich archiviert werden?
- Was soll bei Konvertierungsfehlern passieren
- Welche Metadaten sind nötig, um die archivierten Dokumente über den Zeitraum der Aufbewahrungsdauer wieder aufzufinden?
- Wann beginnt die Aufbewahrungsdauer eigentlich?
- Was soll nach Ablauf der Aufbewahrungsdauer passieren?
- Sollen die zu archivierenden Dokumente in das Archiv kopiert oder verschoben werden?
- Soll ein Link auf die archivierten Dokumente im SharePoint verbleiben?
- Wann und wie erfolgt das Archivierungsereignis?
- Durch den Anwender?
- Durch ein Ereignis (z.B. Freigabeworkflow) oder zeitgesteuert?
- Wer darf auf archivierte Dokumente zugreifen und wie erfolgt der Zugriff auf die archivierten Dokumente?
- …
Was spricht für SharePoint als Basistechnologie?
SharePoint wird bei vielen Kunden als Dokument Management System (DMS) eingesetzt, wobei der Begriff DMS genauso wie Archivierung immer kundenspezifisch zu definieren ist. SharePoint bietet sehr gute Funktionen zur Verwaltung von Dokumenten wie zum Beispiel:
- Strukturierungsmöglichkeit von Informationen über Listen & Bibliotheken
- Metadaten
- Versionierung
- Metadaten
- Inhaltstypen
- Dokumentrichtlinien
- Suche
- Workflows
- Office Integration
- Mehrbenutzerfähigkeit
- Webbasierter und mobiler Zugriff
- Anpassbarkeit
SharePoint hat sich zudem als Quasi-Standard für dokumentbasierte Zusammenarbeit und dokumentbasierte Prozesse in Unternehmen und über Unternehmensgrenzen hinweg etabliert. Daher liegt es nahe, SharePoint auch für die Archivierung von Dokumenten zu nutzen.
Um eine verlässliche und gewichtige Aussage zum Thema Revisionssicherheit mit SharePoint zu erhalten, hat Microsoft die Wirtschaftsprüfungsgesellschaft KPMG beauftragt, einen Bericht zum Thema Compliance mit Microsoft SharePoint Server 2010 mit Fokus auf Handels- du Steuerrecht zu erstellen. Kernaussage des Berichts ist, dass eine unveränderliche Aufbewahrung von Dokumenten in SharePoint grundsätzlich möglich ist, dazu aber zusätzliche organisatorische Maßnahmen im Bereich Administration, Überwachung und Auswertung erforderlich sind, wobei sich die organisatorischen Maßnahmen reduzieren lassen, wenn Dokumente richtliniengesteuert auf WORM fähigen Speichern abgelegt werden.
Die Nutzung von SharePoint ist aufgrund der guten Basisfunktionen, sowie der weiten Verbreitung im Unternehmen sinnvoll. Revisionssicher ist SharePoint – wie jedes andere Produkt – nicht.
Welche Philosophien von Archivlösungen gibt es?
Technische Archivierungslösungen für SharePoint lassen sich grob in folgende
Kategorien einteilen:
- Dateisystembasiert: Diese Archivsysteme speichern alle zu archivierenden Informationen (Dokument und Metadaten) in einem dateisystembasierten Archivierungsspeicher. Welche Speichermedien unterstützt werden, hängt von jeweiligen Archivsystem ab. Üblicherweise lassen sich aber Standarddateisysteme nutzen, genauso wie WORM-Speicher (Write Once, Read Many). WORM Technologien schützen die archivierten Informationen am besten vor ungewollter Löschung / Veränderung. Auffindbarkeit und Zugriff auf archivierte Dokumente erfolgt suchbasiert – zum Beispiel über die SharePoint Suche.
- Datenbankbasiert: Diese Archivsysteme speichern alle zu archivierenden Informationen (Dokument und Metadaten) vollständig in Datenbanken. Die Informationen sind dabei nicht durch das Speichermedium vor Veränderung und Löschung geschützt, sondern durch die Anwendung. Es sind daher weitere Maßnahmen zu ergreifen, um die Daten in der Datenbank vor Veränderung und Löschen zu schützen. Natürlich muss auch die Datenbank vor Löschen geschützt werden, solange sich aufbewahrungspflichtige Dateien darinnen befinden.
Das wohl bekannteste datenbankbasierte Archivsystem ist SharePoint selber. SharePoint stellt mit dem Records Center Archivierungsfunktionen bereit: - Mischform: Bei diesem Produkttyp werden die Dateien auf einem dateisystembasierten Archivierungsspeicher gespeichert, die Metadaten allerdings in einer Referenzdatenbank. Sofern Zugriff auf das Dokument ausschließlich über die Referenzdatenbank erfolgt, so muss diese ausreichend gesichert und Ihrerseits vor ungewollter Veränderung geschützt werden.
Wer stellt die Revisionssicherheit der Lösung fest?
Ob eine Lösung revisionssicher ist, kann im Rahmen eines Audits / Testats durch einen Revisor oder einen Auditor unter Berücksichtigung der Systemdokumentation und den Verfahrensanweisungen geprüft werden. Es ist ratsam, schon in der frühen Projektphase mögliche Auditoren mit in die Lösungskonzeption einzubinden.
Mythen und Irrtümer
„Seit wir SharePoint haben müssen wir archivieren“
Diese Aussage ist grundlegend falsch. Die Anforderung, ob / welche Dokumente zu archivieren sind, ist technologieunabhängig und unabhängig von der Einführung von SharePoint. Wenn für ein Dokument eine Aufbewahrungspflicht besteht, dann muss es ordnungsgemäß aufbewahrt werden. Ob das Dokument initial im SharePoint oder im Dateisystem liegt, ist unerheblich.
„Aufbewahrungsdauer beginnt bei Archivierung“
Leider falsch – das wäre auch zu einfach. Leider beginnt die Aufbewahrungsdauer in den seltensten Fällen mit dem Archivierungsereignis – außer, es wird viel zu spät archiviert. Die Aufbewahrungsdauer für Dokumente ist in Gesetzen oder Unternehmensrichtlinien geregelt, zudem muss der Archivierungszeitpunkt so früh wie möglich sein.
Der Beginn der Aufbewahrungsdauer ist abhängig vom Archivierungszweck:
- Bei steuerlich relevanten Dateien mit Ablauf des aktuellen Kalenderjahres nach letzter Bearbeitung
- Bei produkthaftungsrelevanten Dateien mit dem Ende der Herstellung des Produkts – das ist organisatorisch nicht zu unterschätzen!
„Die Anwender sollen Dokumente archivieren“
Mit dieser so dahingesprochenen Anforderung beginnen viele Archivierungsprojekte. Oft verbirgt sich dahinter die Vorstellung, dass der Anwender mit einem Knopfdruck ausgewählte Dokumente wegarchivieren kann und ggf. noch Parameter definieren kann wie Aufbewahrungsdauer, Metadaten, etc. Das Problem an dieser Herangehensweise ist, dass der Anwender das Archivieren möglicherweise vergisst, oder falsche Parameter wie z.B. Aufbewahrungsdauer wählt. Das Prozess- und Fehlerrisiko liegt also beim Anwender. Besser ist es, zentrale Archivierungsregeln vorzudefinieren und die Archivierung weiterstgehend zu automatisieren und zum Beispiel in bestehende Freigabeprozesse zu integrieren.
„Es gibt revisionssichere Archivierungsprodukte zu kaufen“
Leider nein! Die technische Lösung ist nur der kleinste Teil einer DMS- / Archivierungsgesamtlösung. Nur eine Gesamtlösung (Produkt + Prozess) kann revisionssicher sein.
„PDF/A Konvertierung ist verlustfrei“
Um die Lesbarkeit von Dokumenten gerade bei langen Aufbewahrungsfristen sicherzustellen, werden diese oft in quelloffene Formate wie PDF/A oder TIFF konvertiert. Hier kommt es häufig zu einem Konflikt der beiden Grundprinzipien Lesbarkeit und Unveränderlichkeit. Eine Konvertierung nach PDF/A und TIFF ist analog zu betrachten wie das Ausdrucken von Dokumenten. Hier sind einige Beispiele, die zu Informationsverlust oder Informationsveränderung bei der Dateikonvertierung führen:
- Quelldokument hat dynamische Inhalte wie ‚aktuelles Datum‘, ‚aktueller Anwender‘ oder greift auf externe Inhalte zu. Wird die Konvertierung durch einen Hintergrundprozess ausgeführt, so werden die dynamischen Inhalte möglicherweise verfälscht. Gleiches Problem existiert auch ohne Konvertierung. Immer wenn das Quelldokument geöffnet wird, wird der ursprüngliche Inhalt verfälscht
- Gerade bei Excel, aber auch bei PowerPoint und Word gehen ausgeblendete Inhalte oder zoombare Inhalte im Rahmen der Konvertierung verloren, bzw. sind nicht mehr lesbar.
Im Rahmen des Projektes ist zu klären, wie derartige Konflikte erkannt werden können und wie damit umzugehen ist. Schlussendlich ist zu klären, ob die Informationsveränderung oder der Informationsverlust relevant ist oder nicht.
„Site Collections sollen archiviert werden“
Unabhängig wie die Archivierung einer Site Collection konkret aussehen soll ist zu klären, wie die Lesbarkeit und der Zugriff über lange Jahre sichergestellt werden kann – vor allem, wenn die Aufbewahrungsdauer der Informationen die Lebensdauer und den Supportzeitraum einer SharePoint Farm übersteigt.
Empfehlung: Relevante Informationen sind in Dokumente zu konvertieren und als solche zu archivieren.