DMBOK
Data Management Body Of Knowledge
https://gyazo.com/23ba44554a371996011bd34ba7717b95
https://gyazo.com/075072e3fb977e90582ed2aa91fa2ddf
https://gyazo.com/fe7f91f7434993912e46d34a58f6b360https://gyazo.com/abf540c3931c8a3268a859e2c5cd486e
https://gyazo.com/9a083e73294a683f3c5c3b698cb5844f
phase はとっつき易さ
Maslow の欲求段階論 (ne-sachirou.iconはこれが嫌い) みたいに下の phase が滿たされると上の phase が現はれてくるのではない
(嫌いなものいっぱい有るからね…)
「其んな段階は無い」と云ふ事丈でなく「抑々其んな欲求は無い」「御前は「欲求」と云ふ言葉で何が謂ひたいのか」と云ふ話も有る
八正道のやうに一體であると見るのが近い
phase 0 と phase 4 は wheel 圖には無い
phase 2 の level 3 までは個人技 + αで行ける
+ α で data 利用側と關はってゆく
data 利用が盛んに成り始めず偶に data も見るくらいだと level 2 が限界っぽい
data が critical に成り始めると level 4 を目指せる
phase 0
data 取扱倫理第 2 章
https://gyazo.com/d1f3375edc4089566eb0f066412eec5b
data 取り扱ひ倫理は倫理原則に從ひながら、どのやうに data を生成し、保管し、管理し、解釋し、分析・活用し、廢棄するかを扱ふ。それを實行する community の責任を含む。
phase 1
data modeling と design第 5 章
https://gyazo.com/35b153feed5671bd930d1b617a9b765f
data modeling とは、data 要件を洗ひ出し、分析し、取扱 scope を決める process であり、data 要件を記述し傳へるために、明確に定義された data model と呼ばれる樣式が用ゐられる。この process は反復的であり、槪念、論理、物理 model が含まれる。
3 層 schema : 槪念 model→論理 model→物理 model
star schema
snowflake schema
生 data 重要
要約統計量しか殘ってないと他の要約の仕方が出來ない。segment を變へたり
同じ要約しか見られないと data 利用を改善出來ない (深堀り出來ない景色が當たり前に成ってしまふ)
データストレージとオペレーション第 6 章
https://gyazo.com/8ddd8966f02d77f2cad0720df672d1b8
data の價値を最大化するために、永續化される data を設計し、實裝し、support すること
data security第 7 章
https://gyazo.com/0247e6c51ade61e9eeeaea3df576c805
security policy や手順を定義、立案、開發、實行し、data と情報資產に對して適切な認證と權限付與を行ひ、access を制禦し、監査をすることである。
機密性 (confidentiality)
責任追跡性 (accountability)
否認防止 (non-repudiation)
權限、機密
個人情報 (PII; Personally Identifiable Information)
法令
data 統合と相互運用性第 8 章
https://gyazo.com/11761124b70d6ffecf4b4c325846d74f
application や組織內および相互閒における data の移動と統合を管理する
phase 2
data architecture第 4 章
https://gyazo.com/d87abfdd06cfaa335b2dd7ec03591f1c
企業の (組織構造に関係なく) data needs を明確にし、needs に合う master となる靑寫眞を設計し、維持する。master となる靑寫眞を使って data 統合を手引し、data 資產を control し、business 戰略に合わせて data への投資を行ふ。
data から business 迄の繫がり。business から data への依存
取得 (ingesting) より提供 (serving)、抽出と load (extracting and loading) よりも發見と利用 (discovering and using)
メタデータ第 12 章
https://gyazo.com/15e0862f0f08f2551560b6e73b1b3a50
高品質な統合された metadata を利用できるようにするために activity を計畫し、導入し、統制する
データ品質第 13 章
https://gyazo.com/67d7b1b86c61640af6dad831d3c3c901
品質管理技術を data に適用する activity を計畫し、實施し、制禦する。これによって、data が樣々な目的で利用されて、data 利用者の要求に合致することを保證する。
ETLT pipeline の後段ではなく、元 data の品質を高めると御得
熱設計でも、發熱源に近い箇所に高價な放熱し易い部品を使ったはうが cost performance に優れると云ふ話が有りましたね。PS5 の TIM (thermal interface material) 採用に就いての interview で見た
物理削除難しいと云ふ話
重複を許して BigQueryBigQuery.icon に data を copy し、BigQueryBigQuery.icon 側で ID と updated_at を元に一意化する phase 3
data governance第 3 章
https://gyazo.com/dc608323f2f5b250b62d79daab502a70
data 資產の管理を職務權限を通して統制し、意思決定を共有する (計畫を立て、實行を監視し、徹底させる) こと
DataOps
CDO (Chief Data Officer)
data steward
document と contents 管理第 9 章
https://gyazo.com/8959245467390e38c6694992b5f9bda6
data と information はあらゆる形式と媒體から入手される。これら data と information の lifecycle 管理のため、activity を計畫し、實行し、統制する。
參照 data と master data第 10 章
https://gyazo.com/db0206ce37717de0aa7949962be78c8f
組織の goal を達成し、data の冗長性を生む risk を低減し、より高い品質を保證し、data 統合の cost を削減するために、共有 data を管理する。
參照 data と master data の區別
業務の中で發生する data : master data / transactional data
依存關係の圖では application からの出力として在る
業務の外に元々在る data : 參照 data
依存關係の圖では data governance の中に在る
data warehousing と business intelligence第 11 章
https://gyazo.com/c5bad190575cc1155ca9d2dfdd39cde7
意思決定を支える data を提供して、report 作成、query 發行、分析に携わる knowledge worker を支援するため、計畫を立案し、實行し、統制する。
phase 4
big data と data science第 14 章
https://gyazo.com/88a557ab28026e64b6380744a8bec2b0
分析開始時に走られてもいない問ひに對し、答へと洞察を見つけるため、多種多樣な data を蒐集 (big data) し分析 (data science、分析、視覺化) すること。
data management 成熟度 assessment第 15 章
https://gyazo.com/d43811d661fb4ce31580323dab344308
組織內で實施されている data 關聯業務に對して rank 付けする方法。data management の現狀とそれが組織に與へる影響を明らかにする。
https://gyazo.com/cd8788243140dfae39ed7e6fae3ae768
Level 0 : ぐちゃぐちゃ。ってのも規定されてる
data management 組織と役割期待第 16 章
operationg model
地方分權型 operation model
network 型 operationg model
中央集權型 operationg model
hybrid 型 operationg model
聯邦型 operation model
data management と組織の変革第 17 章