DI:#5 データとは
こんにちは、パースペクティブの德原です。
前回はデータインテグリティを遵守しないとどのようなことに繋がってしまうのかという内容でした。これからデータインテグリティの内容に入って行こうと思いますが、その上で用語に関する理解も大切であるため、まずはデータインテグリティにおける頻出・重要な用語の理解をしておきたいと思います。
そこで第5回では、MHRA*が発出しているガイダンスである”MHRA ‘GXP’ Data Integrity Guidance and Definitions” の第6章 Definition of terms and interpretation of requirements(用語の定義・要件の解釈) で説明されている用語の中から、下記の用語について引用・和訳してご紹介、解説していきます。いずれもデータインテグリティの実務を行う際に出てくる、データや記録に関する用語となります。
◆データ(Data)
◆オリジナルレコード(Original record)
◆生データ(Raw Data, Source Data)
◆メタデータ(Metadata)
”MHRA ‘GXP’ Data Integrity Guidance and Definitions”の原文はこちらからご確認ください。
*MHRA:Medicines and Healthcare Products Regulatory Agency;イギリスの医薬品・医療製品規制庁
◆データ(Data)
<定義>
- 参照または解析のために収集された事実、数値、統計
<解説>
データには下記が含まれます。
- すべてのオリジナルレコード
- すべてのオリジナルレコードの真正コピー*
- オリジナルレコード/真正コピーから生成されるすべての加工データ、報告書
さらにオリジナルレコードは下記を含みます。
- 生データ及びメタデータ
*真正コピーについては一番下の~補足~にて紹介しています。
◆オリジナルレコード(Original record)
<定義>
- 最初に保存されるデータや情報*のこと(コピーではなく原本)
*情報:一定の文脈中で特定の意味をもつもの
<例>
- 観察結果を手書きしたオリジナルの紙の記録
- コンピュータ化システムからの電子的な生データファイル
◆生データ(Raw Dara, Source Data)
<定義>
- 記録形式(紙または電子)によらず、最初に取り込んだデータや情報
<解説>
- “生データは活動を完全に再構成できなければならない。” “もともと動的状態で取得されている場合、動的*状態のまま利用できるようにしておくことが望ましい" とガイダンスに記載されています。(*「動的」については一番下の~補足~にて紹介しています。)
- MHRAの生データの定義は、“最初に取り込んだデータや情報” となっていますが、“活動を完全に再構成できなければならない” とも定められており、「最初」にかかる範囲が分かりにくいかと思います。そのため、厚生労働省のGMP事例集 [問]GMP20-5(文書等の管理)の定義もご紹介しておきます。GMP事例集での生データの定義は、最終結果に至るまでの過程も含まれることが明記された定義となっています。
<参考:GMP事例集での生データの定義>
最終結果を得るために使用した元となるデータ及び最終結果を得るに至った過程を含む記録のことをいい、最終結果が正しく出されたことを検証することができるものであることが必要である。
<参考:GMP事例集での生データの例>
例えば、試験検査に係る生データとしては、次のものが挙げられる。
1.測定機器からプリント機能により出力されるデータ
2.記録計から出力されるチャート又は読み取った値を記録したもの
3.測定機器に表示される値を書き取ったもの
4.観察結果を書きとめたもの
5.チャートなどの波形データを電子的に記録したファイル
6.写真
7.
上記のデータを使用し計算、換算等を行った際の過程を記録したもの等
◆メタデータ(Metadata)
<定義>
- 他のデータの特性を記述し、関連性と意味を提供するデータ
<解説>
メタデータは、一般的に構成、データ要素、相互関係、およびその他の特性を記述するデータをいいます。またメタデータはデータを個人に(または自動的に生成される場合は元のデータソースに)帰属させることも可能です。
例えば、下記のようなオリジナルレコードのとき、下線の部分がメタデータにあたります。
「右記を秤量した。sodium chloride Lot 1234, 3.5mg. D.I 2021年02月01日」
3.5 というデータ(数値)だけだと意味が分かりませんが、メタデータがあると塩化ナトリウムロット1234 3.5mg をD.Iさんが2021年02月01日に秤量したものと分かります。
このようにメタデータはデータに補足情報と意味を与えます。
<例>
- 単位
- タイムスタンプ
- ユーザーID
- 機器のID
- 原材料の識別番号
監査証跡※
※監査証跡とは、GXP記録の生成、変更、削除に紐づく活動に関連する情報のことです。監査証跡によって、レビュアー(レビューする者)は、データを「誰が、いつ、何から何に、なぜ変更、削除したか」を追跡できるようになります。
~補足~
補足として、データの形式及び状態を表す用語である、下記について紹介しておきます。
- 真正コピー(True Copy)
- 動的(Dynamic)
- 静的(Static)
■真正コピー(True copy)
<定義>
下記の条件を満たしているオリジナルレコードのコピー
- オリジナルと同じ情報を持つ(補足情報、内容、構造を記述するデータを含む)
- オリジナルと同じ情報を持つことが検証されている
<解説>
同じ情報を持つことが検証されている というのは下記で示されます。
- 日付入りで署名されている
- バリデートされたプロセスによって生成されている
■動的(Dynamic)
<定義>
データの追跡・傾向確認・クエリ(問合せ) が可能で、再処理したり、詳細を確認したりすることができる電子的な形式
<例>
- データの再解析や詳細確認ができるクロマトグラフィの電子記録
- データベース形式の情報
- 計算式の入っているスプレッドシート
■静的(Static)
<定義>
内容が固定されていて、再処理やさらなる詳細を確認することができないデータや記録の形式
<例>
- 紙の記録
- PDF形式のような電子記録
以上、今回は、データ、生データ、メタデータなどの定義を紹介しました。次回は、データインテグリティの原則であるALCOA+について紹介していきます。