教育データ標準に花束を

「教育データ標準」について考える駄文の続きです。(前回

文部科学省が取り組んでいる「教育データ標準」という取り組みは,サービス提供者や使用者が「相互に交換,蓄積,分析が可能となるように収集するデータの意味を揃えること」を目的としています。

データの意味を揃える」というのは,たとえば,アンケート質問に対する選択肢を統一するような試みのことです。

「職業」の選択肢を用意するとき,「学生/社会人/…」とするか,「小・中学生/高校生/大学生/サラリーマン/自営業/…」とするか。これがバラバラだと調査結果の比較が面倒になるのと同じで,教育データも記録するデータの意味を揃えないと交換,蓄積,分析で面倒が生ずるというわけです。こういうのを「データの桁を揃える」みたいに表現することもあります。

ちなみに,心理学における心理測定(心理アンケート調査)の世界では「尺度集」というものが蓄積されており,これを共有することで,別々に実施された測定結果を比較検討できるような文化があります。いろんなジャンルのものがありますが,子どもの発達に関係するものを集めた『心理測定尺度集IV 子どもの発達を支える〈対人関係・適応〉』(サイエンス社)は有名です。

さて,教育データ標準のお話。この取り組みはいま3年目を迎えています。

これまで「学習指導要領コード」と「学校コード」を公表し,さらに児童生徒と教職員と学校と教育委員会という「主体情報」に関するデータ項目の定義を公表しました。下のリンクが文部科学省「教育データ標準」のWebサイトになります。

前回も見ましたが再度,そこで公開されている「主体情報」のデータ項目の一覧を覗いてみましょう。

画像はExcelファイルにリンクしています。

図の文字が小さくて読めないとは思いますが,児童生徒の主体情報についてずら〜っと項目が羅列されていることが分かります。

「こんなにたくさんのデータ項目をつくって個人の情報を記録するのか!!」と抵抗感を抱きたくなりますが,こういうものはあらかじめ用意しておくことに意味があります。

つまり,データをしまう場所は確保しておくけど,実際にデータをしまうかどうかは別の話。

たとえば「ミドルネーム」という項目は,日本ではミドルネームもっている人がまだ少ないので,実際には使わない空っぽな項目になりがちです。だからといって,この項目定義をけずってしまったら,ミドルネームを持っている人達が自分の名前を記録できなくなってしまいます。

文部科学省の説明では…

(留意点)
・標準化の対象はデータの全てを教育データ項目を網羅しているものではなく、データの相互運用性を図る観点から全国的な定義の統一が必要なものを中心に優先的に整備している。
・ここで定義している情報を各学校等で集めなければならないものではない。(法令等で規定されている情報等は当該規定に従う必要がある。)
・標準項目以外に各学校設置者、学校で必要と考えるデータがあれば独自に定義して活用することは可能。

という留意点が付されています。「これが全部じゃないよ」「全部集めるわけじゃないよ」「新たに項目作っていいよ」というわけです。

児童生徒の名前は「fullName」という定義名にして,一方,教職員の名前は「staffFullName」という定義名にすれば区別がつくでしょ…といった約束事が項目ごとにずら〜っと決められている。そのことがとても大事だということです。

教育データ標準とは,たとえて言えば,種類の豊富なバイキングメニューです

私たちは食べたいだけのメニューをバイキングから選んでトレイ皿の上に盛りつけていくことになりますが,とはいえ栄養バランスにも気をつけたいので定番メニューは押さえつつ選ぶといった調子になるわけです。

教育データの場合,好き勝手な組合せでは具合が悪いこともあります。そこで,おすすめの組合せ「推奨データセット」なるものを用意して,どれを選んだらよいか迷う人達に提示しようというアイデアも出ています。

とはいえ,このおすすめセットの選定は,言うほど簡単ではありません。

「主体情報」(個人情報)といった,特定対象物を表現するためのデータセットを決めることは,ある程度分かりやすい作業です。

しかし,教育データは「主体情報」×「活動情報」×「内容情報」という異なる区分を掛け合わせることが前提となります。これは「個人データ」+「成績データ」といったシンプルな話に留まり得ないということです。

いや,どうも周りの皆さんは,そのシンプルな話にしたがっているようです。

〈教育データセット〉=「個人データ」+「成績データ」という構成で利用されると想定できれば,〈教育データセット〉−「個人データ」によって匿名化された成績データの集合をビッグデータ分析が可能であるともっていけるからです。

これを〈教育データセット〉=「個人データ」+「活動データ」+「成績データ」としても同じような論法で分析の対象に出来るということかも知れません。

確かに,現実的にはそういう教育データの推奨セットを提示することになるのかも知れない。

けれども,それは前回の駄文で書いたように,管理者や開発者には意味があるとしても,利用者にとっての教育データセットとしての意味は生み出せるんだろうか?と疑問符が浮かぶわけです。

もう一度,教育データ標準が描いている情報の区分を見てみましょう。

教育データ標準というバイキングメニューから,データセットを盛りつけるだけの準備は整っていません。用意できたメニューは〈主体情報〉のデータ項目と学校コード,〈内容情報〉の学習指導要領コードだけです。

大きな区分の残りひとつ〈活動情報〉を記録するためのデータ項目も早く定義しなければなりません。

文部科学省としては〈活動情報〉を児童生徒の「生活活動」と「学習活動」,教職員の「指導活動」に区分して検討することを考えているようです。これはこれで検討をしてもよいでしょう。

けれども,いよいよ〈主体情報〉×〈内容情報〉×〈活動情報〉のデータセットを考えるとなると,実はこれらを盛りつけるための「トレイ皿」に注目しなければなりません。

仮に呼ぶなら「教育データコンテナ」という捉え方で教育データを組み合わせる必要があります。

コンテナといっても,別にそれほど大そうなものではありません。

たとえば校務や学習系アプリケーションで利用されている名簿交換の技術標準であるOneRosterワンロースター)では,複数のCSVファイルを束ねる形も採用していて,「manifest.csv」というコントロールファイルで複数のCSVファイルの管理情報を記録するように定めています。これも言ってみればコンテナのようなものです。

〈主体情報〉〈内容情報〉〈活動情報〉を束ねるコントロール情報を含んだ「教育データコンテナ」として扱うようにすれば,今後新たな情報区分が増えたとしても教育データコンテナに加えるだけで対応ができます。

〈主体情報〉〈内容情報〉〈活動情報〉を「〈主体情報〉+〈内容情報〉+〈活動情報〉」して,これを教育データコンテナとして扱うことも可能ですが,繰り返すように「〈主体情報〉×〈内容情報〉×〈活動情報〉」する形で扱うことを考えたいのです。

さっきから,足し算と掛け算で何が表わしたいのか,読者には意味不明かも知れません。

端的には,教育データコンテナ自体にデータ本体を保持するかしないかの違い,といってもよいかも知れません。

たとえば,教育データコンテナに〈主体情報〉そのものは保持されない,あるいは識別子のみ保持されるといった構成です。識別子がある場合も,識別子からAPI等で主体情報にさかのぼれる場合と,主体から一方方向に認証できるだけの場合が考えられます。設定次第で教育データコンテナを分析研究用のビッグデータセットとして直接利用できるかも知れません。

個人的に,教育データコンテナは〈活動情報〉を土台としたものになると考えていて,そこに〈内容情報〉が内包される形をとるのが自然ではないかと考えています。活動を単位とした教育データコンテナが無数に生成されるというイメージです。そして,無数にある教育データコンテナの中から関係するものが〈主体情報〉によって領有されるというわけです。(逆に言えば,手放すこともできる理屈です。)

そうなると,当然のことながら教育データコンテナを格納していく場所が必要になることが見えてきます。

この場合の「格納」は技術的にデータを記録保持する場所という意味もあり得ますが,もう少し抽象的なデザインレベルの議論を続けさせてもらうと,私たちが教育データコンテナ(活動単位)を把握するための枠組みが必要だということです。

それは,もうシンプルに「タイムライン」を考えればよいのではないかと考えています。

この部分は,教育データコンテナを格納するアイデア次第で,いろんな広がりが生まれる部分と考えていて,うまくいけば学習eポートフォリオに再び光が当たるかも知れない領域ですが,技術的な設計をちゃんと組み立てて,それを一般の皆さんにも理解してもらわないと,また個人データが私企業に流れるとかなんとかで誤解を受けてしまいかねないところだと思います。

ただ,少なくとも「学校タイムライン」は教育データ標準の範疇で扱えるのではないかなと考えています。

ここで視点を変えて,学校の教育活動をデータとして整えていくことを考えてみたいのです。

今後,学習者一人ひとりの学習活動のパスウェイ(道筋)はますます多様化していきます。それを学習者タイムラインとして記録していくというアプローチも当然あってよく,自分の学習履歴が教育データコンテナの集積として時系列的に記録されるというのはイメージしやすいと思います。

もう一方で,学校という場はどうなっていくのか。

時間割どおりの授業が展開する昔ながらの風景が続くところもあるでしょうし,チャイムもなく学習活動は個人個人のプランにもとづいて展開していくといった学校も当たり前のように存在するかも知れません。あるいは,もう実空間に集まるといった形ではない遠隔や仮想空間上のコミュニケーションとして学校という場が存在することもあるかも知れない。

いかなる形の学習活動(それを記録する教育データコンテナ)が生成されるとしても,それを学校という場の活動として取り込み位置づけることが必要です。まぁ,そんなに多様な現実になったら,そこまで「学校」という枠組みに固執しなくてよいんじゃないかとは思いますけれど,とにかく学校が存在するというならば,学校として教育データコンテナを格納できるような土台を用意しておきたいわけです。そんな土台が必要ないというならば,逆説的にもはや学校という場もいらないということです。

学校タイムラインは,素朴に表現すれば一番最初に言及した「時間割」をベースにしたものです。

昭和な学校を想定して説明するなら,何年何月何日の月曜日1時間目といった「活動時間枠」毎にどんな集団がどんな活動を行なったのか,時間割の情報をもとに学校タイムラインの土台を整えておくのです。

この学校タイムラインの土台が整うだけで何が可能になるかというと,「このクラスの先週火曜日の3時間目は何の授業だった?」という検索に対して答えられるようになるということです。

たとえば,AlexaとかGoogleアシスタントとかSiriと接続してみたとしましょう。

社会科の先生が,昨日の2時間目に社会科授業をしていて,今日は3時間目に社会科授業の続きをする状況を想像します。いざ授業を始めるときに先生はパソコンにこう呼びかけるのです。

「OK,昨日のスライド表示して」

するとAIアシスタントは,学校タイムラインの情報をもとに,現在が社会科授業であることを察知し,次に昨日の授業から社会科が実施された時間帯を検索し,その時間帯に開かれたスライドファイルをパソコンから呼び出してスクリーンに投影する…なんてことが可能になります。

これは学校タイムラインの情報だけを利用した想像事例ですが,このように学校のカリキュラムを時間割ベースでデータ化した学校タイムラインを土台に,学習集団の名簿データや教育データコンテナとのリレーション(関連)を結んでいくことによって,学習者の学習活動を学校タイムラインに配していくことが可能になります。

もちろん,教育データコンテナを児童生徒の主体情報とセットで学校タイムラインに結びつけていくためには,初めの段階で学習者から学校関係者に対して情報アクセスに関する包括的な許諾を手続きする必要があると思われます。こうした学習者の領有する教育データに対する学校関係者のアクセス権は,在学期間中に限定するなどの時限式であったりもするかも知れません。

いずれにしても,学習者は自身の学習者タイムラインの上に教育データコンテナをプロットすることによって学習履歴をコントロールできるし,学校関係者も許諾にもとづき学校タイムラインのもとで教育データコンテナへのアクセスが可能になるというデザインです。

これとは別に学習eポートフォリオのような形で教育データコンテナをプロットできる仕組みが出来れば,それを転校する際の教育データの受け渡しフォーマットとして利用することができるかも知れません。それはそれで交換用のフォーマットを考える必要があると思いますが…。

今回は,図の作成まで手が回っていないので,まさに駄文の羅列でアイデアを書き連ねることとなり,伝わるものも伝わらない感じになっているかも知れません。

途中,考えるために作図はしていましたが,ラフなもので,完成もしていません。

雰囲気だけ…

実際の「教育データ標準」的には,活動情報についてはオンラインコースの学習履歴を記録する技術標準を土台に考えたがっているようで,果たして私たちの実際の学校の教育活動にどれだけフィットするものになるかは,正直よく分かりません。

途中にも書いたように,単なる学習成果のみならず,学習活動の道筋(パスウェイ)も重視されるようになるとすれば,単なる学習コースの履歴だけでなく,異なる学習活動が組み合わさった道筋自体を表現できるデータ構造が必要になってくるはずです。

今回の妄想は,そのパスウェイをタイムラインとして表現したわけですが,あるいはそれはマップという表現形式かも知れませんし,それはいろいろあり得ると思われます。

そのいろいろ様々あり得るということを考えると,私たちは教育データ標準を決めるというだけでなく,教育データ標準を定期的あるいは継続的にアップデートするプロセスなり体制なりを確立することの方が重要なのではないかとも思えます。

物事は生み出している間は活発にやれていても,ピークに達すると衰退していくのが常。

そのことが分かっているなら,むしろその対処を真剣に考えることの方が重要に思えます。

プログラミング的思考 -4

「プログラミング的思考」について情報収集をしています。連番[1][2][3

文部科学省における「プログラミング的思考」なる言葉の初出に関しては,

荒井陽貴,佐藤守,木下龍
「文部科学省におけるプログラミング的思考に関する議論の過程と内容的特質」(千葉大学教育学部研究紀要)
https://opac.ll.chiba-u.jp/da/curator/900120468/

が詳しくまとめています。その中で,第2回有識者会議での議論として『磯津政明委員によって,はじめて「プログラミング的思考」という表現が使われた。』と指摘されています。

その磯津氏によって上梓された本に当時の様子が記録されています。プログラミング的思考という表現がもたらされた背景を説明する部分なので,長くなりますが引用します。

 ちなみに、私は「プログラミング的思考」の提唱者です。現在NHKで放送されているEテレのプログラミング番組「テキシコー」のタイトルは、「プログラミング『的思考』から取られたものです。
 小学生のプログラミング教育に関する文科省の有識者会議に招かれたのが2016年初頭で、当時、先駆けた事例となっていたのは英国で2014年に導入されたプログラミング教育でした。週1回の授業で、プログラムやパソコンのしくみ、デジタルリテラシーについて学ぶ、というものです。
 しかし、当時は2020年時点で小学生が一人一台パソコンが使える見通しは立っておらず、さらに既存の授業が多すぎてプログラミングを新たな科目にはできないことが決まっていました。ということは、英国の授業をそのまま流用することは現実的ではありません。
 そこで私が目をつけたのがCT(Computational Thinking・計算論的思考)と呼ばれる、以前から存在していた問題解決手段です。「分解」「バターン認識」「抽象化」「アルゴリズム設計」の4要素を組み合わせて課題を解決するというものです。
 このCTをあらためて分析してみると、日本人が好むパズル的な算数問題に、CTの要素がうまくちりばめられていることに気づきました。仮に学校でコンピューターを直接操る教育ができないとしても,CTを学んでもらうことはできそうです。
 しかし,いかんせん教育研究の世界で使い古された言葉でしたし、日本語直訳の「計算論的思考」という言葉も広まっていました。日本向けにアレンジするのであれば、日本の小学生向けのプログラミング教育を象徴する別のキーワードの方が良さそうです。そこで社内で議論を重ね、有識者会議の数日前に思いついたのが「プログラミング的思考」でした。そのときにGoogle検索をしても一件もヒットしなかったので、会議の場で発表し、意見書として文科省にも提出しました。
 ちなみに、Google検索をしたとき、想定していた内容が検索ページ上位に表示され、見つけやすいことを「ググラビリティが高い」といいますが、「プログラミング的思考」はトップクラスのググラビリティだったことになります。
 あらためてプログラミング的思考を私なりに定義すると「物事のしくみを深く分析・理解し、具体と抽象を行き来しながら、新しい物事を創造的に生み出す思考方法」です。

磯津政明『2040 教育のミライ』(実務教育出版 2022)p246-248より
(太文字やかぎ括弧不足はママ)

上記の内容を整理すれば…

  1. プログラミング的思考はComputational Thinkingを由来としていたこと
  2. Computational Thinkingを「以前から存在していた問題解決手法」と認識していたこと
  3. Computational Thinkingは「教育研究の世界で使い古された言葉」と認識していたこと
  4. 「計算論的思考」という言葉も広がっていたと認識していたこと
  5. プログラミング的思考は「日本向けにアレンジ」する発想のもとで生まれたこと
  6. プログラミング的思考は「日本の小学生向けプログラミング教育を象徴するキーワード」として模索されたこと
  7. プログラミング的思考は一企業の中での議論を経て思いついたもの
  8. プログラミング的思考のググラビリティの高さを評価していること
  9. 有識者会議に対する意見書として文部科学省に提出したこと

以上の事柄を読み取ることができます。

1. は公開済みの有識者会議記録からも確認できます。また,2.も認識として問題はないと思われます。

3.は有識者会議が開かれていた2016年時点で,世界的な文脈であればComputational Thinkingに光を当てたWing論稿が2006年発表なので10年ほど議論された期間がありましたが,日本の文脈ではそもそも言葉自体知られていなかったといえます。4.の「計算論的思考」もWing論稿の日本語翻訳が公表されたのが2015年でしたから広まっていたというよりも広まり始めたぐらいだったと言えます。

つまり,3.と4.に関しては磯津氏の認識の勇み足。世界事情に通じている点は有識者会議に貢献していたことは事実ですが,日本の文脈についてはほぼ現実を見誤っていたと思われます。

そのうえ,5.のような「日本向けにアレンジ」するという発想を取る際には,アレンジの必要性や方向性を明確にすべきところですが,それが6.の「日本の小学生向けプログラミング教育を象徴する」という粒度では,批判検討するには粗すぎます。8.の「ググラビリティの高さ」が「象徴」に値する理由だったと解釈されても仕方ない説明です。

本来であれば,9.で提出されたような言葉は有識者会議や構成メンバーによって吟味されるべきところですが,有識者会議記録では,第3回における他の委員からの質問のやりとりだけで,その他の箇所で「プログラミング的思考」なる言葉の妥当性を検討した形跡はありません。7.にもとづけば,一企業の社内による議論を経て思いついた言葉が,国の政策用語に採用されたことになります。

プログラミング的思考は,結果的に国の政策用語となり,高いググラビリティを推されながらも,なぜか英語表記について考慮されることもなく,提唱者の著書からさえ引用部分以降の本文では注意深く排除されているのです。

次期学習指導要領の準備のための議論が始まろうとしている現在。解説にのみ記載されている「プログラミング的思考」を見直すことは必須になります。これを学習指導要領本体に採用すべきかどうか。あるいは解説からも排除し,コンピュテーショナルシンキングへの理解を深めたうえで適切な言葉を検討するか。真剣に考えなければならない課題です。

教育データ標準に捧ぐ戯言

2022年9月5日(月)に「教育データの利活用に関する有識者会議(第12回)」があるそうです。

「教育データ」について相互利用ができるよう形式を統一し,規格を整備したりすること,またその利用促進について話し合いが進められています。

教育データ標準の目的とは,サービス提供者や使用者が「相互に交換,蓄積,分析が可能となるように収集するデータの意味を揃えること」としていることが文部科学省のスライドから分かります。

これに続けて別のスライドには,もう少し細かなことを書き込んだものが続きます。

記載されている「Pedagogy First, Technology Second」とか「学習活動の効果の最大化を念頭においた標準化」とか「多様な社会の力を活用できるための標準化」とかは,「教育データの相互運用性」を実現するにあたっての『願い』みたいなものの表明に見えます。

データ標準化だけでは,「Pedagogy First」にはならないし,「学習活動の効果の最大化」にはつながらないし,「多様な社会の力を活用」することにはならないけれど,教育データの標準化が,どうかそうした意志を持つ人々に届いてその方向性で利用されますように…という「願い」が込められたスライドのようです。

「願い」への気持ちは忘れずに,本来の「教育データの相互運用性」を実現することに特化して,やるべきことを考えると,まずは「日本全国で定義の統一が必要なもの」から取り組むという方針は理にかなっています。ローカル事情満載の個別的・局所的なものを対象としたデータの標準化に取り組むのは,事情が異なり多様な事象を扱わなくてはならなくなるので後回しです。

全国で共通しているものからデータ標準化すれば「共通して使用することで相互のメリット」が得られる可能性は高いわけです。いや,普通そうです。だからデータ標準化に意味があります。

しかし,その相互メリットが「教育データを互いに活用することで児童生徒がより付加価値の高い学びが可能となる等の意義が高くなること」なのかどうかと問われたら,いくら私がPedagogy Firstな人だとしても,「さて,どうでしょう…」と中空を見つめるしかありません。「願い」ではあるから,折よく,そんな付加価値の高い学びを提供してくれる機会が得られたら,そうかもね,としか答えようがありません。

おそらく「相互メリット」なるものは別にあって,付加価値の高い学び云々とは別のところにある。だから,ここに掲げられたメリットを理由として「データ標準」の使用を強制できないのも当然のこと。それでも,別にあるはずの相互メリットのために粛々と,今後開発されるシステム,導入されるべきシステム,文部科学省の様々な行政事務において,教育データ標準化への対応を取り組まなければならないのです。

では,別の相互メリットって何なのか?

この問いにステークホルダーごとに答えようと試みたものが下図です。

「教育データ標準化」がもたらす相互メリットと,教育データ標準化が「データ活用を促進」してもたらされるメリットが混在している表なので,上手くいけばみんなハッピー(広範なステークホルダーに寄与)を羅列したものになっています。

ステークホルダー間を越えて取り結ぶ「教育データの相互運用性」が実現されると,本当にこれらのメリットが享受できるのかは不明です。できそうな気もしますが,それは「最高の食材が届けられるから最高の料理ができそうな気がする」ことと同じではないでしょうか。素材の扱い方次第ともいえそうです。

私たちは,最高のシェフがいる前提で,最高の食材をどこからでも迅速に届けてもらえる仕組みをつくろうとしている。そうでなければ最高のシェフとて最高の料理はつくれやしない。いや,最高のシェフがいなかろうと,最高の食材を明日にでもお取り寄せできる仕組みが構築されれば,どの家庭にも嬉しい。そんな感じです。

話が逸れました。

広範なステークホルダー間を越えた教育データの相互運用性について議論すると,やりたいことが広範になって話がぼやけます。それでも,上の表に記載されたメリット群から浮かび上がるキーワードがあるとすれば,それは何なのか。

思うに,Pedagogyでもなく,Technologyでもなく,「Utility」ではないでしょうか。

穿ってBusinessと書くこともできそうですし,Business First, Pedagogy Second, Technology Thirdと言った方が,率直じゃないかと思ったりもします。Utilityだって詰まるところ,Businessのことなのですから。

ともかく,Businessなるものを「商売」と捉えるか,単なる「仕事」とか「用件」と捉えるかは,人それぞれでいいはずですが,誤解を避けるため,ここではUtility(実用性,効用)といった言葉にしておきます。

そのUtilityとは具体的に何なのか。結論をもう少し先送りしながら,お互いのコンセンサスを醸成していった方がよいと思いますが,教育の分野にそれが足りていなかったのではないかとは思うのです。


さて,それではUtilityをもたらす,「教育データ標準」とは何ぞや。

上のスライドは文部科学省が描いている「これが教育データとして変換される情報のイメージですよ」というスライドです。逆に言えば,(すべて完備された暁には)記録された教育データをもとに覗くとこういった学校の中の様子を掴めますよ,さかのぼって知ることができますよ,ということです。

こうした教育データが「相互運用性」を持つというのはどういうことか。

一番分かりやすいのが教育データの受け渡しが発生する場面,つまり転校するときです。元の学校で記録したデータを転校先の学校に渡してそのまま読み込むことができるのが相互運用の一例です。正確には「相互交換」の例です。シームレスでいちいち変換する手間がない。

転校のような特殊なシチュエーションでないとメリットがないわけではありません。

日常的な校務で情報処理する際や,子どもたちが授業で学習サービスを利用する際は,複数のコンピュータが連携して動作している場合がほとんどです。それらコンピュータ同士が動作中にそのままデータを交換するためにも教育データの標準が決まっている必要があるのです。シームレスでデータが行き交っている。

さてはて,これは誰にとってのメリットなのでしょう。

コンピュータ同士がデータをシームレスに受け渡し合えること自体はコンピュータにとっての話に見えます。そのことが結果的には人間にも「手間をかけさせない」ことにつながれば嬉しいね,いやそうあるべきだ…ということだと思われます。


けれども,人間って誰?っていう風に続くわけです。

そこは一枚岩ではありません。

教育データ標準のメリットを享受する人間は,利用者だったり,管理者だったり,開発者だったりします。

利用者であれば「児童生徒」「教諭」「学校事務」「養護教諭」「ICT担当教諭」などがあるかもしれません。さらに管理者として「教頭」「副校長」「校長」「指導主事」「学校教育課担当者」「教育長」などあります。喜ぶポイントが異なる人達が混在しているのです。

しかも,利用者や管理者を直接喜ばすのは教育データ標準ではありません。実のところは,開発者がよりよいシステム開発を試みて成功した場合に利用者や管理者にメリットが届くのです。

これが,教育データ標準の議論が立場によって違ったものに見える理由です。

この教育データ標準というお話は,学校教育の中にいる利用者や管理者にとっては直接的な話ではありません。その人達を相手にしている開発者やそれを取り巻く人々にとっての問題なのです。Businessというキーワードが関係する余地はこういうところにもあるわけです。

もしも利用者や管理者にメリットをもたらすことが目的であれば,各社が独自ノウハウで便利なものを提供すればよいはずです。他社のシステムとのデータ交換も,各社が「変換機能」を用意すれば済むことです。もしもTechnology Firstを信ずるなら,変換に際して手間のかかりそうな項目や定義のすり合わせも,AI補助を用いたり,UXを工夫するなりの技術的な創意工夫で解決する方向性もあり得ます。

各社がそのような企業努力や開発力の発揮をすることで競争することがBusinessというものです。

Business的な「競争領域」については,説明スライドにも記されています。この「各社が創意工夫を行い独自に機能を実装」する方向性を自前主義ともいいます。

しかし,技術開発の世界にはまた別の原則が働いており,それが教育データ標準などの「標準化」あるいは「規格化」に対する強い動機を持ち込むのです。「協調領域」と書かれている部分がそれにあたります。

技術開発者は,効率性や合理性を尊重します。乱暴にいえば面倒くさがりなのです。すでに良いやり方があるなら,自分で一から用意せずに,それを再利用した方が圧倒的に楽です。

これを「車輪の再発明はしない」という風に表現することがあります。

Business的な競合相手だとしても,ともに同じ目的の製品を開発し,お互いの製品間でデータを交換するニーズがあるなら,協調し合って共有できることは共有した方が互恵的です。

加えて,同じ敵を相手にするならば,共闘するが得策です。

その共通の敵とは,たとえば,文部科学省が用意する公的なシステムです。そのためにノウハウを交換し合えれば,開発者にとっては大いにメリットになります。

開発者にとってのUtilityが高まれば,システム自体の開発が容易になり,創意工夫に余力を回すことができる。これが利用者や管理者へのメリットにつながる可能性があるということです。それをBusinessとしての成果につなげられるかは各社の努力です。

「標準化」や「規格化」は,既存の開発者に対してUtilityをもたらすだけではありません。

新たな開発者の参入を容易にします。

場合によっては利用者や管理者が開発者になる可能性を拓きます。標準や規格を策定し,準拠するノウハウがオープンに公開されることの大きなメリットは,誰もが開発することに参加できることなのです。

逆に言えば,標準化や規格化をする作業自体は,既存の開発者へのUtilityはもちろんですが,むしろ,新たな開発者の参入容易性を確保すること(低参入障壁)を最優先に取り組まれなければならないのです。

私個人は,利用者の傍らに「開発」もしくは「開発者」がもっと近づいてくれることを目指すべきと思います。それはWebサービスで利用できるとか,スクリプト言語から呼び出せるとか,ツールに読み込ませると面白い活用を生み出せるとか,そういうエリアにフォーカスすべきだと思います。私がUtilityという言葉を持ち出すのも,そういうところを強調したいからです。


さて,もう一度このスライドを見てみましょう。

2つ上のスライドを再掲

図中「主体情報」「内容情報」「活動情報」と大きく3つ区分されているのは,なんでなのかというと,このスライドとは別のスライドで,既存の国際標準規格とか関係団体標準とか,すでに教育データを標準化しようとした試みを参照してみたら,情報を3つに分けて扱っていることが分かったと整理されているからです。

確かに,学校というものを分解して考えようとするとき,大学の講義でも最初の取っ掛かりに提示するのは下図のようなものなわけです。

それで私たちは各要素(「学習者」「指導者」「内容」)の属性であるとか変数などを見定め,その役割や機能について理解をし,どのような手続きやコミュニケーションの活動を行なう存在なのか把握しようとします。それらを記録できるようなデータの形式があったら便利だね嬉しいねということになります。

教育データ標準化の取り組みはすでに進められているので,取り組めるものから取り組んで「教育データ標準」という名称でその定義や形式を公開しているわけです。現在は第2版(2021年度)まで出ています。

この公開サイトで何が提供されているかというと,下図の四角で囲まれた部分(主体情報定義と学校コードと学習指導要領コード)の教育データ標準がExcelファイルで公開されているのです。

主体情報のデータ項目を定義したExcelファイルを覗くと,へぇ〜私たちの主体情報ってこんな項目を記録するんだと,なかなか興味深く読めます。児童生徒も教職員も,基本情報セクションに「在留カード番号」を記録する項目がある(しかも識別子との順が両者で逆になっている)のは興味深いです。それって基本情報なんだ。

学習指導要領コードは,年度ごと,学校種ごとにコードファイルを分けて配布していて,修正バージョンも複数あります。学校コードも,東と西で二分割したファイルを配布していて,幾度か修正更新されています。それから教育委員会コードも公開されています。

これらを見ると,どこからか「はい,決めましたよ。はい,出しましたよ。」という声が聞こえそうです。

もう少し利用しやすい形で公開はできないものでしょうか。

これでは,利用者が開発者になるとか,学習で活用したくなる…とは思えません。

たとえば,Googleスプレッドシートに読み込ませて公開する方法を採用してみてはどうでしょう。例として,古いバージョンですが,実際に学校コードを一括化して公開したものがあります。

これとて使いやすいわけではありませんが,Excelファイルをダウンロードして(全国一括で見たいなら東西を合体させて)参照しなければならないことに比べれば,まだマシです。修正を反映してくれれば,いつでも最新バージョンを利用することができます。

しかも,上の例は,学校ごとに位置情報を付加していますので,学校間交流をしている相手校とか全国の学校の所在地を,地図上で確認することに利用できます。学校コードの定義の中に位置情報も含んでもらえれば,もっと普段の学習活動にも利用できるはずです。

文部科学省サイトで公開している学校コードファイルは,たとえると冷凍した食材で,使うためには解凍しなければならない面倒がある…とでも表現しましょうか。

おなじ冷凍でも,文部科学省もGitHubアカウントを確保して,そこに一括ファイルをアップロードして置いてくれてもいいんじゃないでしょうか。そうすれば修正のバージョン管理もできるし,いろんな人々が修正を提案することもできます。

〈追記/*〉学校コードや学習指導要領コードについては,利用しやすいように外部の団体や組織が独自に公開している例がすでにあるようです。

こちらはGitHubを使って学習指導要領コードをLinked Open Dataとして公開している事例。

こちらは学校コードを検索できるようにしたWebサイトの事例。

学校コードは相談次第ではAPIでの利用への対応もしてくれるようです。

本来はこうした基礎的データベースを文部科学省など国レベルで提供できるようにするのが本筋ですが… 〈*/〉

もっとも,現在の事業予算では,利便性確保までは事業範疇(予算)に入っていないのでしょう。関係者はみんな,そうした方が便利であることは分かっているし,反対ではないけれど,それが仕事には入ってないから取り組めないという,行政あるあるです。

「教育データの利活用に関する有識者会議」は,そういうことをちゃんと指摘する機会になるべきだと思います。Business寄りのことばかり議論せず,利用者や開発者のUtilityを議論して欲しい。そう願います。


ちなみに,学習指導要領コードについて,とあるデジタル教材コンテストの応募作品で,これをデータとして含めたコンテンツ作品に出会ったことがあります。一つ一つの教育素材にコードが付いてたのです。

「おっ,実際に利用されている!」と,ちょっとワクワクしたのですが,残念ながら個別の教育素材にコードを振っただけでした。

もし,ひとつの教育素材に振られたコード(複数ある)のどれかをクリックしたら,同じコードを振られた教育素材がズラッとリストアップされたら面白かっただろうに。そうはなっていなかったのです。

教育データ標準の取り組みで「学習指導要領コード」を定義して公開して,それが確かに利用されたとしても,その結果はあまりメリットをもたらさなかった例です。少なくともその時点では感じられなかった。

いまは「教材事業者等が活用しやすい形(Excel,CSV形式)で文科省ホームページにデータを掲載している」学習指導要領コードを,将来的には,デジタル教材連携サイトの構築やコンテンツへのコード付与支援ソフトウェアの開発をすることで,なるべく利用しやすくしたい計画は持っている様子。

これが実現すれば,私たちはSNSのツイートや書き込みに,簡単に学習指導要領の該当部分を引用する仕組みを開発できます。その引用に学習指導要領コードが埋め込まれることで簡単に教科書や教材へのリンクが張れるということにもなるし,自分のデジタルノートにもそれを貼り付けることができるようになります。

ただ,これも「事業者」を念頭に議論を続けていると,まったく後回しにされてしまう世界です。

協調領域をBusiness寄りで議論することは大事ですが,むしろ利用者や管理者のUtility寄りで議論を展開してもらわないと,標準化はしたけれど…利用は促進されなかった,マイナンバーみたいだね,となってしまいます。

教育データ標準の議論が様々なレイヤーや領域と多岐に渡っているため,学習者情報のダッシュボードのような便利そうな部分の話とか,相互運用性を問題する話とか,利用促進の話とか,こういうブログで取り上げやすい話とかも限定的になりがちで,正直なところ,全体把握できているのは一部の人達だけです。

果たして,教育データ標準の取り組みが周り回って私たちにとってのメリットに本当につながるのかどうか。それはやってみなければ分からないのだろうというのが外野からの景色なのです。(このブログは外野です〈追記/*〉とは若干言えなくなったみたいだけど…はは。せいぜい文句言います。〈*/〉)


教育データ標準の議論は,もっと大きなところでは,私に「図書館の自由に関する宣言」と「図書館員の倫理綱領」の存在を思い起こさせます。

本来,児童生徒あるいは学習者には,自己に関する情報のコントロール権や学習に関する権利が保障されているはずですが,学校教育が学校教育法や学習指導要領のもとで展開される中で,そこにある程度の制限が加えられるケースも起こり得ます。

そのバランスをどう考えるか,私たちの中でコンセンサスが醸成されているとは言えません。

このあと,教育データ標準の議論は「内容情報」と「活動情報」についてコマを進めようとしています。

図書館の例えでいえば,図書コードの形式を定義して,利用者の図書利用情報をどのような形式で記録できるようにするかを策定する取り組みです。

そうやって例えたときに,図書館には「宣言」と「倫理綱領」があったなぁと思い出すのです。

図書館の自由に関する宣言は「図書館は、基本的人権のひとつとして知る自由をもつ国民に、資料と施設を提供することをもっとも重要な任務とする」として,この任務を果たすため以下を確認・実践をするとしています。

第1 図書館は資料収集の自由を有する
第2 図書館は資料提供の自由を有する
第3 図書館は利用者の秘密を守る
第4 図書館はすべての検閲に反対する

そして「図書館の社会的責任を自覚し、自らの職責を遂行していくための図書館員としての自律的規範」が合わせて示されているのです。(長くなるので引用は控えます)

学校と図書館では位置づけが異なるとは思います。しかし,利用者の秘密を守る,利用者を差別せず,利用者の秘密を漏らさないという部分は,そのままでないにしても何かしら学校でも同じような倫理的な再確認を行なわなければならないと考えます。

個人情報やプライバシーにかかわる議論は,「教育データの利活用に関する有識者会議 論点整理(中間まとめ)」でいくらか議論されています。

今後,Q&Aのようなものが作成されて,事業者や教育職員に対してどのような倫理的行動を取るべきかが示唆されるとは思います。


私自身は,外野の人間として,教育データ標準のいくつかや,国際標準団体の規格などが趣味の休日プログラミングからでも利用しやすくなることを期待しています。

文部科学省の有識者会議や,企業と連携している専門家の議論は,私たち市井の人間からすると,いつも向こう側の開発者にとっての議論に終始していて,利用者として開発にかかわろうとする素人には難し過ぎです。

私たちは自らの学習を楽しく彩るために,学習履歴や学習活動データを自分で着色したり編集したりレイアウトしたいのです。そういう立場で議論している人達がどこかにいてくれることを願います。