JP2014199504A - Customer specific data cleansing processing system and customer specific data cleansing processing method - Google Patents
Customer specific data cleansing processing system and customer specific data cleansing processing method Download PDFInfo
- Publication number
- JP2014199504A JP2014199504A JP2013073930A JP2013073930A JP2014199504A JP 2014199504 A JP2014199504 A JP 2014199504A JP 2013073930 A JP2013073930 A JP 2013073930A JP 2013073930 A JP2013073930 A JP 2013073930A JP 2014199504 A JP2014199504 A JP 2014199504A
- Authority
- JP
- Japan
- Prior art keywords
- data
- data cleansing
- policy
- provider
- master
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 232
- 238000003672 processing method Methods 0.000 title claims description 120
- 238000000034 method Methods 0.000 claims description 252
- 230000008569 process Effects 0.000 claims description 234
- 238000003860 storage Methods 0.000 claims description 21
- 235000016496 Panda oleosa Nutrition 0.000 claims description 4
- 240000000220 Panda oleosa Species 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000004886 process control Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 230000004044 response Effects 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 238000007418 data mining Methods 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 235000012149 noodles Nutrition 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 240000005499 Sasa Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 238000009933 burial Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、顧客別データクレンジング処理システム及び顧客別データクレンジング処理方法に関する。 The present invention relates to a customer-specific data cleansing processing system and a customer-specific data cleansing processing method.
更に、詳しくは、複数のデータ提供者、例えば複数のサービス提供事業者などから提供される各種データを収集し、例えば、当該データの集計、分析、データマイニングなどを実行した結果をデータ享受者側に提供することが可能なデータ提供システムに適用して好適な顧客別データクレンジング処理システム及び顧客別データクレンジング処理方法に関する。 More specifically, various data provided by a plurality of data providers, for example, a plurality of service providers, etc. are collected, and for example, the result of executing the aggregation, analysis, data mining, etc. of the data is the data receiver side. The present invention relates to a customer-specific data cleansing processing system and a customer-specific data cleansing processing method suitable for application to a data providing system that can be provided to a customer.
インターネットの発展に伴い、企業の業種や業務内容を切り口にして、それぞれに有効なサービスを提供する各種サービス事業者、例えば飲食業界に対して人気メニューなどの商品情報を提供するサービス事業者や当該サービス事業者に食材などを提供したりするサービス事業者や小売サービス事業者、食材などの生産事業者などが増加している。 Along with the development of the Internet, various service providers that provide effective services based on the type of business and content of businesses, such as service providers that provide product information such as popular menus to the food and beverage industry There are an increasing number of service providers, retail service providers, and food producers who provide foods to service providers.
例えば、近年、インターネットやWebなどを利用して、飲食店などのサービス享受事業者側に特定の業務サービスを提供するサービス提供事業者側に対して、その特定の業務サービスの基盤となるサービス基盤を提供し、該サービス基盤に基づく業務サービスをもってサービス享受事業者側のビジネスを支援するサービス提供システムが存在する。 For example, in recent years, a service platform serving as a basis for a specific business service for a service provider that provides a specific business service to a service receiving business such as a restaurant using the Internet or the Web. There is a service providing system that provides services and supports the business of the service receiving business with business services based on the service infrastructure.
このようなサービス提供システムは、サービス基盤事業者装置、サービス提供事業者装置、サービス享受事業者装置、及びユーザ端末装置を有する。 Such a service providing system includes a service platform operator device, a service provider operator device, a service receiving operator device, and a user terminal device.
サービス基盤事業者装置は、提供するサービス基盤に基づく機能(サービス)、例えばSaaS(Software as a Service)型による業務システムをサービス提供事業者装置に提供するシステム又は装置である。 The service platform operator device is a system or device that provides a service provider device with a function (service) based on the service platform to be provided, for example, a SaaS (Software as a Service) type business system.
サービス提供事業者装置は、サービス基盤事業者装置から提供されるサービス基盤に基づく業務システム(業務SaaS)を受けるシステム又は装置である。また、例えば、当該業務システムをサービス享受事業者(或いは直接ユーザから)の要求に応じてカスタマイズしてサービス享受事業者に提供するシステム又は装置である。 The service provider device is a system or device that receives a business system (business SaaS) based on a service platform provided from a service platform operator device. Further, for example, it is a system or apparatus that customizes the business system according to the request of the service receiving business operator (or directly from the user) and provides it to the service receiving business operator.
サービス享受事業者装置は、サービス提供事業者から提供されるサービスを受けるシステム又は装置である。また、例えばユーザから提供されるユーザ情報をサービス提供事業者装置側に提供する装置である。 The service receiving provider device is a system or device that receives a service provided from a service provider. Further, for example, it is a device that provides user information provided by the user to the service provider device side.
ユーザ端末装置は、例えば、自らユーザ情報を入力し、サービス享受事業者装置側に提供する端末である。また、このユーザ端末装置は、ユーザ自身の携帯端末をかざすことにより、当該携帯端末の情報を自動的に収集することができるようなものであってもよい。
そして、サービス享受事業者やサービス提供事業者が所有するオリジナルユーザ情報は、有益な情報を含んでいる。サービス基盤事業者は、この有益なオリジナルユーザ情報の提供を受け、当該情報の分析を可能とすれば、よりよいビジネス支援を行うことが期待できる。
The user terminal device is, for example, a terminal that inputs user information and provides it to the service receiving provider device side. In addition, the user terminal device may be a device that can automatically collect information on the mobile terminal by holding the user's own mobile terminal.
And the original user information which a service receiving provider and a service provision provider own contains useful information. If the service platform provider is provided with this useful original user information and can analyze the information, it can be expected to provide better business support.
本技術分野の背景技術として、特開2009−93569号公報(特許文献1)、特開平9−153094号公報(特許文献2)、特開2012−141847号公報(特許文献3)がある。 As background arts in this technical field, there are JP-A-2009-93569 (Patent Document 1), JP-A-9-153094 (Patent Document 2), and JP-A 2012-141847 (Patent Document 3).
特許文献1には、SaaS環境からSI環境へ変更する場合、SaaS形態で利用を始めた業務サービスにおいて、埋没コストや機会損失の発生を軽減するものであり、業務サービスをSaaS事業者環境(A社)からSI形態の環境(B市)に移行する場合、B市に業務サービスのアドレスを記録するサービスアドレスリストを設け、業務サービスの移行に合わせてサービスアドレスリストのアドレスを更新する。また、A社に蓄積された業務データも移行する場合、A社及びB市に業務データのアドレスを記録するデータアドレスリストを設け、業務データの移行に合わせて双方のデータアドレスリストのアドレスを更新する。それらの更新においては、アドレスが論理的に同一になるようにアクセス方法を変更する技術が開示されている。
In
特許文献2には、顧客に関する情報と、顧客が商品の購入を検討したときに参照した商品の情報と、顧客が購入した商品の情報とから商品の販売促進効果を分析する販売促進効果分析方法及びその実施システムが開示されている。
特許文献3には、後続の各処理で用いる処理条件を定義する定義ファイルを作成し、記憶領域に格納する定義ファイル作成部と、記憶領域から読み出した定義ファイルを用いて、データクレンジング処理前又は後の移行元DBのデータの妥当性のチェック処理を実施し、チェック処理結果を出力するチェック処理部と、記憶領域から読み出した定義ファイルを用いて、ロード後の移行先DBに格納されたデータの妥当性を検証し、検証処理結果を出力する検証処理部とを備え、画面処理部は、表示装置にチェック処理結果および検証処理結果を表示するデータ移行システムが記載されている。
In
特許文献1に記載されたようなサービス提供システムによれば、サービス基盤事業者は、サービス提供事業者の業務支援ができる。また、サービス提供事業者は、サービス享受事業者の業務支援ができる。そして、これらの業務支援により、システム全体の業務を効率化でき、業務効率を向上することができる。
According to the service providing system described in
また、係るサービスを提供する各サービス提供事業者及びサービス基盤事業者側では、それぞれ各ユーザに関するデータ、例えば嗜好や行動履歴などのデータを保持(蓄積)、管理しているのが通常である。 In addition, each service provider and service infrastructure provider that provides such a service usually holds (accumulates) and manages data related to each user, for example, data such as preference and behavior history.
従って、このユーザに関するデータを分析し、当該分析結果に基づく有益な情報やオリジナルデータをサービス提供事業者からサービスの提供を受ける側のサービス享受事業者(店舗、一般企業など)に対して、提供できるシステムがあれば、より業務効率を向上することが期待できる。 Therefore, this user data is analyzed, and useful information and original data based on the analysis results are provided to service users (stores, general companies, etc.) that receive services from service providers. If there is a system that can do this, it can be expected to improve operational efficiency.
ここで、本発明における「ユーザ」とは、本システムを利用する個人、団体、企業であり、特定ユーザ(一の個人、一の団体、一の企業が特定可能なユーザ)と不特定ユーザ(個人、団体、企業が特定不可能又は特定困難なユーザ)を含む。ユーザが本システムで使用する端末等を「ユーザ側端末」と言う。以下、本発明において、ユーザに関して「個人」とした用語はユーザとしての団体及び企業を含むものである。 Here, the “user” in the present invention is an individual, group, or company that uses the system, and a specific user (one person, one group, one user that can identify one company) and an unspecified user (one user, one group, one company can be specified). Individuals, organizations, and companies that cannot or cannot be specified). A terminal or the like used by the user in this system is referred to as a “user side terminal”. Hereinafter, in the present invention, the term “individual” with respect to the user includes organizations and companies as the user.
また、「サービス享受事業者」とは、本システムによる本来事業支援サービス(第1のサービス)の提供を受ける事業体であり、当該サービス享受事業者側に設けられたシステム構成装置を「サービス享受事業者装置」と言う。ここでの「側に設ける」との用語の意義は、サービス享受事業者内に設けることのみを意味するものではない。この「側に設ける」との用語は、以下同様に用いる。 In addition, the “service enjoying operator” is an entity that receives the original business support service (first service) by this system, and the system component device provided on the service enjoying operator side is referred to as “service enjoying operator”. Say "business equipment". The meaning of the term “provided on the side” here does not mean that the term “provided in the service receiving service provider” is provided. The term “provided on the side” is used in the same manner hereinafter.
また、「サービス提供事業者」とは、本システムによる本来事業支援サービス(第1のサービス)を提供する事業体であり、当該サービス提供事業者側に設けられたシステム構成装置を「サービス提供事業者装置」と言う。 A “service provider” is an entity that provides an original business support service (first service) using this system, and a system component device provided on the service provider side is referred to as a “service provider business”. Say the device.
また、「サービス基盤事業者」とは、複数のサービス提供事業者を束ねる企業であって、サービスの基盤、例えば業務や予約機能(業務サービスや予約サービス)などをサービス提供事業者及び/又はサービス享受事業者に提供する事業体である。そして、契約に基づきサービス享受事業者装置及び/又はサービス提供事業者装置から、情報を随時収集し、当該情報を例えば分析して、サービス享受事業者側及び/又はサービス提供事業者側に分析情報(第2のサービス)として提供する。ここで、提供する情報は、分析情報に限る必要はなく、例えばデータ提供者からの要求に応じて、オリジナルデータをそのままの非分析情報を提供するものであってもよい。当該サービス基盤事業者側に設けられたシステム構成装置を「サービス基盤事業者装置」と言う。 In addition, a “service infrastructure provider” is a company that bundles a plurality of service providers, and provides service infrastructure such as business and reservation functions (business services and reservation services) and / or service providers. It is a business entity provided to the enjoying business. Then, information is collected from time to time based on the contract from the service receiving provider device and / or the service providing provider device, and the information is analyzed, for example, and analyzed to the service receiving provider side and / or the service providing provider side. Provided as (second service). Here, the information to be provided need not be limited to analysis information, and for example, in response to a request from a data provider, non-analysis information with the original data as it is may be provided. A system component device provided on the service infrastructure provider side is referred to as a “service infrastructure provider apparatus”.
また、「データ提供事業者」、また「データ享受事業者」とは、サービス提供事業者やサービス享受事業者を指している。そして、例えばオリジナルユーザ情報Ia、Ibをそのままの生データ、或いはk−匿名性を満たす匿名化データXIa、XIbとしてサービス基盤事業者側に提供するデータとして送信し、また当該データをサービス基盤事業者側にて分析した分析データ、或いは生データとして受信する。当該データ提供事業者側に設けられたシステム構成装置を「データ提供事業者装置」と言い、当該データ享受事業者側に設けられたシステム構成装置を「データ享受者装置」と言う。
なお、データ提供者側として、「データ提供事業者」とし、データ享受者側として、「データ享受事業者」としているが、「事業者」に限らず、「ユーザ」個人であってもよい。従って、後述する実施例では、単に「データ提供者」、「データ享受者」と言う場合もある。
In addition, “data provider” and “data receiver” refer to a service provider and a service receiver. For example, the original user information Ia and Ib are transmitted as raw data as they are or as data to be provided to the service platform operator as anonymized data XIa and XIb satisfying k-anonymity, and the data is also transmitted to the service platform provider. It is received as analysis data or raw data analyzed on the side. A system component device provided on the data provider side is referred to as a “data provider unit”, and a system component unit provided on the data receiver side is referred to as a “data receiver unit”.
The data provider side is a “data provider” and the data receiver side is a “data receiver”. However, the data provider is not limited to a “provider” but may be a “user” individual. Therefore, in the embodiments described later, there may be simply referred to as “data provider” and “data receiver”.
また、サービス基盤事業者は、複数のサービス提供事業者を束ねる企業であることから、当該サービス基盤事業者側において、複数のサービス提供事業者側に蓄積している各種データを融合し、又は統合し、分析することができれば、より高付加価値な分析が可能となり、その結果として、サービスをサービス提供事業者、及び/又はサービス享受事業者を含むユーザに対して、より高付加価値な分析結果を提供することが可能となる。 In addition, since a service infrastructure provider is a company that bundles multiple service providers, the service infrastructure provider integrates or integrates various data stored in multiple service providers. If it can be analyzed, higher value-added analysis becomes possible, and as a result, higher value-added analysis results for users including service providers and / or service users Can be provided.
大容量データの分析が可能なIT環境が整いつつある現状にあっては、技術的には、大容量データから、上述した高付加価値な分析を行うことは可能である。 In the present situation where an IT environment capable of analyzing a large amount of data is being prepared, it is technically possible to perform the above-described high added value analysis from a large amount of data.
「高付加価値な分析」とは、パーソナライゼーション(Personalization:得意客、及び見込みユーザごとの好みや属性に応じた情報を電子メールなどで発信すること)や併売リコメンド (recommendation:、ユーザの好みを分析し、各ユーザごとに興味のありそうな情報を選択して表示するサービスのこと)などを実現可能にする基礎データを提供するための分析を言う。 “High-value-added analysis” means personalization (sending information by e-mail, etc.) according to personalization (customers and prospective users' preferences and attributes), and recommendations for simultaneous sales (recommendation: user preferences). This is an analysis for providing basic data that can be realized by analyzing and selecting information that is likely to be interesting for each user.
上述したサービス提供者側及びサービス基盤事業者側において、サービス提供者側から各種データを収集し、例えば、収集したデータを集計・分析するとき、当該データを、集計、分析(解析)などに耐えうるようにするためにデータクレンジング(data cleansing)処理を行う必要がある。その理由は、データ入力者の入力ミスやデータ処理の不具合などによりデータの一部が不正値となることがあるためである。 At the service provider side and the service infrastructure provider side, various data are collected from the service provider side. For example, when collecting and analyzing the collected data, the data is resistant to aggregation and analysis (analysis). In order to achieve this, it is necessary to perform a data cleansing process. The reason is that a part of the data may become an illegal value due to an input error of the data input person or a defect in data processing.
このデータクレンジング処理する場合、主に、以下の二通りの方法が一般的である。
第一は、サービス提供者(以下、テータ提供者と言う)用装置10側から提供するデータ(元データ)を、当該データ提供者用装置側にて、データクレンジング処理を行い、当該データクレンジング処理済みのデータ(データクレンジング処理後データ)をデータ享受者(以下、データ享受者と言う)用装置20側に提供する方法である。
この方法の場合は、データクレンジング処理ポリシをデータ提供者側のポリシに従うか、もしくはデータ享受者側のポリシに従うかは、2社間で取り決めておくことが要求される。
When performing this data cleansing process, the following two methods are generally used.
First, data (original data) provided from the service provider (hereinafter referred to as the data provider)
In the case of this method, it is required to decide between the two companies whether the data cleansing processing policy conforms to the data provider side policy or the data receiver side policy.
第二は、データ提供者用装置10側から提供される元データを受け取るデータ享受者用装置側にて、当該元データのデータクレンジング処理を行う方法である。
この方法の場合、(1)データ享受者用装置20側は、元データが正常値か不正値かの判断が難しい。また、(2)データ提供者用装置10側のデータクレンジング処理ポリシに従うか、もしくはデータ享受者用装置20側のデータクレンジング処理ポリシに従うかの判断も必要であり、これら(1)及び(2)は、データ提供者側とデータ享受者側の2社間の取り決めておくことが要求される。
The second is a method of performing data cleansing processing of the original data on the data receiver device side that receives the original data provided from the
In this method, (1) it is difficult for the data recipient device 20 side to determine whether the original data is a normal value or an illegal value. In addition, it is also necessary to determine whether to follow the data cleansing process policy on the
因みに、元データの値が正常値であるか、または不正値(データクレンジング処理すべき値)であるかを、一番熟知しているのは、元データの所有者であるデータ提供者側である。 By the way, it is the data provider who is the owner of the original data that knows whether the value of the original data is a normal value or an incorrect value (value to be subjected to data cleansing processing). is there.
一方、データ提供者側が、その元データをデータ享受者側に提供する場合、提供データを利用するのはデータ享受者側であり、データクレンジング処理は、データを利用する側であるデータ享受者側のデータクレンジング処理ポリシに従う場合が好適である。 On the other hand, when the data provider side provides the original data to the data receiver side, the data receiver side uses the provided data, and the data cleansing process is the data receiver side that uses the data. It is preferable to follow the data cleansing processing policy.
このように、データ提供者側、又はデータ供給者側でデータクレンジング処理を行う方法は、データ提供者側とデータ享受者側が1対1の場合は、2社間の取り決めで容易に実現可能である。 As described above, the method of performing the data cleansing process on the data provider side or the data provider side can be easily realized by an agreement between the two companies when the data provider side and the data receiver side are one-to-one. is there.
しかし、データクレンジング処理ポリシが相違する複数のデータ提供者及び複数のデータ享受者を対象とするシステム、例えば、データ提供者側の数がN者、データ享受者側の数がM者のように数が増えるシステムへの適用については考慮されていない。 However, a system targeting a plurality of data providers and a plurality of data receivers having different data cleansing processing policies, for example, the number of data providers is N, and the number of data receivers is M. It is not considered for application to a system with an increasing number.
つまり、当該システムへの適用の場合、例えば、データ提供者側の数がN者、データ享受者側の数がM者のように数が増えるシステムにあっては、システム構成が複雑となり、以下のような課題がある。 That is, in the case of application to the system, for example, in a system in which the number of data providers is N and the number of data receivers is M, the system configuration becomes complicated, There is a problem like this.
N者いるデータ提供者側でデータクレンジング処理すべき値を処理する場合、M者いるデータ享受者側の各々のデータクレンジング処理ポリシに従ってデータクレンジング処理をすることになり、データ提供者側は、N者に対して、各々M回データクレンジング処理を行わなければならない。 When processing data cleansing values on the N data provider side, the data cleansing process is performed according to each data cleansing policy on the M data receiver side. The data cleansing process must be performed M times for each person.
逆に、M者いるデータ享受者側でデータクレンジング処理をする場合、N者いるデータ提供者側から元データを取得して、同時にN者いるデータ提供者側からデータクレンジング処理すべき値(不正値)を設定されている場合、M者いるデータ享受者側は、各々N回データクレンジング処理をしなければならない。 Conversely, when the data cleansing process is performed on the data receiver side where the M person is present, the original data is acquired from the data provider side where the N person is present, and at the same time the data cleansing process is performed from the data provider side where the N person is present (illegal Value) is set, the data receiver side with M persons must perform data cleansing processing N times.
即ち、データ提供者側がN者、データ享受者側がM者いる場合、効率的なデータクレンジング処理する装置が必要である、という課題があった。 That is, when there are N persons on the data provider side and M persons on the data receiver side, there is a problem that an efficient data cleansing apparatus is necessary.
vまた、前記特許文献1には、クライアントからの指示に基づき、移行元DBをデータクレンジング処理するデータクレンジング処理部を有し、ユーザが、移行先システムのデータの妥当性を判断することが可能なデータ移行システムが記載されている。しかし、複数のデータ提供者から複数のデータを受信、収集し、複数のデータ享受者にデータクレンジング処理したデータを提供するシステムにおいて、データクレンジング処理をシステム的に行う、ことまでは考慮されていない。特許文献2,3も同様である。
v Further,
そこで、本発明は、データ提供者側の数がN者、データ享受者側の数がM者のように数が増えるシステムにあっても、データクレンジング処理をシステム的に行える顧客別データクレンジング処理システム及び顧客別データクレンジング処理方法を提供する。 Therefore, the present invention provides a data cleansing process for each customer that can perform the data cleansing process systematically even in a system in which the number of data providers is N and the number of data beneficiaries is M. A system and customer-specific data cleansing processing method are provided.
上記課題を解決するために、本発明は、基盤事業者用装置側にデータクレンジング処理ポリシマスタ及び当該マスタのデータ提供者用装置から提供される元データの不正値の型に対するデータクレンジング処理ポリシを元にデータクレンジング処理する顧客別データクレンジング処理手段(データクレンジング処理サーバ)を有し、当該データクレンジング処理ポリシをデータ享受者用装置から設定可能な構成とする。 In order to solve the above problems, the present invention is based on the data cleansing process policy for the illegal type of the original data provided from the data cleansing process policy master and the master data provider apparatus on the infrastructure provider apparatus side. The data cleansing processing unit (data cleansing processing server) for each customer that performs data cleansing processing is provided, and the data cleansing processing policy can be set from the data receiver device.
例えば、本発明の顧客別データクレンジング処理システムは、
少なくとも1つのサービス基盤事業者装置と、複数のデータ提供者装置と、複数のデータ享受者装置とを有したデータ提供システムであって、
前記サービス基盤事業者装置は、
入出力手段、記憶手段、制御手段、を有し、
前記入出力手段は、
前記データ提供者装置及び前記データ享受者装置との間でデータの授受を行い、
前記記憶手段は、前記データ提供者装置から提供されるデータにデータクレンジング処理するデータクレンジング処理ポリシマスタを有し、
前記制御手段は、前記データクレンジング処理ポリシマスタのデータクレンジング処理ポリシをもって、前記データのデータクレンジング処理を行う機能を有し、
前記データ提供者装置から提供されるデータ、及び当該データのフィールド型属性情報を受信する受信部と、
前記データクレンジング処理ポリシを受信するデータクレンジング処理ポリシ受信部と、
前記データクレンジング処理ポリシに従って、前記データ提供者装置から提供されるデータをデータクレンジング処理するデータクレンジング処理手段と、
前記データクレンジング処理手段にてデータクレンジング処理した後のデータクレンジング処理後データを前記データ享受者装置に送信する手段と、
を有することを特徴とする。
For example, the customer-specific data cleansing processing system of the present invention is:
A data providing system having at least one service infrastructure company device, a plurality of data provider devices, and a plurality of data receiver devices,
The service platform operator device is:
Input / output means, storage means, control means,
The input / output means includes
Send and receive data between the data provider device and the data beneficiary device,
The storage means includes a data cleansing processing policy master that performs data cleansing processing on data provided from the data provider device.
The control means has a function of performing a data cleansing process of the data with a data cleansing process policy of the data cleansing process policy master,
A receiving unit that receives data provided from the data provider device and field type attribute information of the data;
A data cleansing process policy receiving unit for receiving the data cleansing process policy;
Data cleansing processing means for performing data cleansing processing on data provided from the data provider device according to the data cleansing processing policy;
Means for transmitting the data cleansing data after the data cleansing processing by the data cleansing processing means to the data receiver device;
It is characterized by having.
前記制御手段は、更に、
前記データ享受者装置のデフォルトデータクレンジング処理ポリシ、前記データ提供者装置から提供されるデータ用のデータ享受者データクレンジング処理ポリシ、及び前記データ提供者装置のデフォルトデータクレンジング処理ポリシ、前記データ提供者装置から提供されるデータ用のデータ提供者データクレンジング処理ポリシを受信し、前記データクレンジング処理ポリシマスタに反映する手段、
を有することを特徴とする。
The control means further includes
Default data cleansing processing policy of the data receiver device, data receiver data cleansing processing policy for data provided from the data provider device, default data cleansing processing policy of the data provider device, and the data provider device Means for receiving a data provider data cleansing processing policy for data provided from and reflecting the data on the data cleansing processing policy master;
It is characterized by having.
前記制御手段は、更に、
フィールド型属性マスタ、不正値マスタ、処理方法マスタ、を有し、当該フィールド型属性マスタ、不正値マスタ、処理方法マスタ、から前記サービス基盤事業者装置のデータクレンジング処理ポリシを作成する手段を有し、前記データクレンジング処理ポリシマスタに反映する手段は、前記サービス基盤事業者装置のデータクレンジング処理ポリシを前記データクレンジング処理ポリシマスタに反映する
ことを特徴とする。
The control means further includes
A field type attribute master, an illegal value master, a processing method master, and a means for creating a data cleansing processing policy for the service infrastructure provider device from the field type attribute master, the illegal value master, and the processing method master. The means for reflecting in the data cleansing process policy master reflects the data cleansing process policy of the service infrastructure provider apparatus in the data cleansing process policy master.
前記データクレンジング処理ポリシマスタは、前記データ提供者装置から提供されるデータの元データフィールド名、当該フィールド名のフィールド型属性に生じうる各々の不正値に対応する処理方法を含み、
前記不正値は、「空白(NULL)」、「全角半角不統一」、「不正文字」、「異常値」、「ひらがな文字不統一」、「カナ文字不統一」、「英字不統一」、「数値不統一」、「記号不統一」、「漢字文字不統一」、「電話番号非正規化」、「郵便番号非正規化」、「住所非正規化」、「金額非正規化」、の1つ以上であり、
前記フィールドの型属性は、「主キー」、「名前」、「郵便番号」、「住所」、「数量」、「金額」、「日付」、の1つ以上であり、
前記処理方法は、「何もしない」、「レコード全てを削除」、「データ提供者フォーマットに合わせる」、「データ提供者正規化に合わせる」、「空白にする」、「平均値に置き換える」、の1つ以上である
ことを特徴とする。
The data cleansing process policy master includes an original data field name of data provided from the data provider device, a processing method corresponding to each illegal value that may occur in the field type attribute of the field name,
The illegal values are “blank (NULL)”, “full-width half-width inconsistency”, “illegal character”, “abnormal value”, “hiragana character inconsistency”, “kana character inconsistency”, “English letter inconsistency”, “ 1 of "Numeric Ununiformity", "Unidentified Symbol", "Unidentified Kanji Character", "Denormalized Phone Number", "Denormalized Postal Code", "Denormalized Address", "Denormalized Amount" Two or more
The type attribute of the field is one or more of “primary key”, “name”, “zip code”, “address”, “quantity”, “amount”, “date”,
The processing methods are “do nothing”, “delete all records”, “fit to data provider format”, “fit to data provider normalization”, “blank”, “replace with average value”, One or more of the above.
また、本発明の顧客別データクレンジング処理システムは、
事業者のデータ提供者用装置から提供される元データを受け、当該元データをデータ享受者用装置に提供する基盤事業者用装置を備え、複数の事業者間で共有するデータをデータクレンジング処理する顧客別データクレンジング処理システムにおいて、
前記基盤事業者装置は、
前記データ提供者用装置からの元データをデータクレンジング処理するデータクレンジング処理制御装置及び前記元データの各フィールドに生じうる不正値を定義する不正値マスタ、前記元データの各フィールドに生じうる不正値に対する処理方法を有するデータクレンジング処理ポリシマスタを有し、
前記データ提供者用装置は、
前記元データに対して、当該データの値が不正値の場合、当該不正値が前記不正値マスタのどの項目に対応するかを指定する手段を有し、
前記データ享受者用装置は、
前記元データに対して網羅的に準備したフィールド型属性型に対して、不正値に対する処理ポリシを設定する手段を有し、
前記データクレンジング処理制御装置は、
前記データ提供者用装置側にて設定した元データのフィールド型属性情報に対して、前記データ享受者用装置側にて設定した処理ポリシを前記データクレンジング処理ポリシマスタから読み取る読取手段と、当該読み取ったデータクレンジング処理ポリシに従って前記元データをデータクレンジング処理する制御手段と、を有する
ことを特徴とする。
The customer-specific data cleansing processing system of the present invention is
Data cleansing processing for data shared between multiple providers, including a base provider device that receives original data provided from the provider's data provider device and provides the original data to the data receiver device In customer-specific data cleansing processing system,
The infrastructure provider device is
A data cleansing processing control device that performs data cleansing processing on original data from the data provider device, an illegal value master that defines an illegal value that can occur in each field of the original data, and an illegal value that can occur in each field of the original data A data cleansing processing policy master having a processing method for
The data provider device comprises:
When the value of the data is an illegal value with respect to the original data, there is means for specifying which item of the illegal value master the illegal value corresponds to,
The data receiver device is:
Means for setting a processing policy for illegal values for field type attribute types prepared comprehensively for the original data;
The data cleansing process control device includes:
Reading means for reading the processing policy set on the data receiver device side from the data cleansing processing policy master for the field type attribute information of the original data set on the data provider device side, and the reading Control means for performing data cleansing processing on the original data in accordance with a data cleansing processing policy.
また、本発明の顧客別データクレンジング処理方法は、
少なくとも1つのサービス基盤事業者装置と、複数のデータ提供者装置と、複数のデータ享受者装置とを有したデータ提供システムにおける顧客別データクレンジング処理方法であって、
前記サービス基盤事業者装置は、
入出力手段、記憶手段、制御手段、を有し、
前記入出力手段は、
前記データ提供者装置及び前記データ享受者装置との間でデータの授受を行い、
前記記憶手段は、前記データ提供者装置から提供されるデータにデータクレンジング処理するデータクレンジング処理ポリシマスタを有し、
前記制御手段は、前記データクレンジング処理ポリシマスタのデータクレンジング処理ポリシをもって、前記データのデータクレンジング処理を行う機能を有し、
前記データ提供者装置から提供されるデータ、及び当該データのフィールド型属性情報を受信するステップと、
前記データクレンジング処理ポリシマスタのデータクレンジング処理ポリシを受信するステップと、
前記データクレンジング処理ポリシに従って、前記データ提供者装置から提供されるデータをデータクレンジング処理するステップと、
前記データクレンジング処理手段にてデータクレンジング処理した後のデータクレンジング処理後データを前記データ享受者装置に送信するステップと、
を有することを特徴とする。
The customer-specific data cleansing processing method of the present invention includes:
A data cleansing processing method for each customer in a data providing system having at least one service infrastructure provider device, a plurality of data provider devices, and a plurality of data receiver devices,
The service platform operator device is:
Input / output means, storage means, control means,
The input / output means includes
Send and receive data between the data provider device and the data beneficiary device,
The storage means includes a data cleansing processing policy master that performs data cleansing processing on data provided from the data provider device.
The control means has a function of performing a data cleansing process of the data with a data cleansing process policy of the data cleansing process policy master,
Receiving data provided from the data provider device and field type attribute information of the data;
Receiving a data cleansing process policy of the data cleansing process policy master;
Performing data cleansing processing on data provided from the data provider device according to the data cleansing processing policy;
Transmitting data cleansing-processed data after data cleansing processing by the data cleansing processing means to the data receiver device;
It is characterized by having.
前記制御手段は、更に、
前記データ享受者装置のデフォルトデータクレンジング処理ポリシ、前記データ提供者装置から提供されるデータ用のデータ享受者データクレンジング処理ポリシ、及び前記データ提供者装置のデフォルトデータクレンジング処理ポリシ、前記データ提供者装置から提供されるデータ用のデータ提供者データクレンジング処理ポリシを受信し、前記データクレンジング処理ポリシマスタに反映するステップ、
を有することを特徴とする。
The control means further includes
Default data cleansing processing policy of the data receiver device, data receiver data cleansing processing policy for data provided from the data provider device, default data cleansing processing policy of the data provider device, and the data provider device Receiving a data provider data cleansing process policy for data provided from and reflecting it in the data cleansing process policy master;
It is characterized by having.
前記制御手段は、更に、
フィールド型属性マスタ、不正値マスタ、処理方法マスタ、を有し、当該フィールド型属性マスタ、不正値マスタ、処理方法マスタ、から前記サービス基盤事業者装置のデータクレンジング処理ポリシを作成するステップを有し、前記データクレンジング処理ポリシマスタに反映する手段は、前記サービス基盤事業者装置のデータクレンジング処理ポリシを前記データクレンジング処理ポリシマスタに反映するステップを有する
ことを特徴とする。
The control means further includes
A field type attribute master, an illegal value master, a processing method master, and a step of creating a data cleansing processing policy for the service infrastructure provider device from the field type attribute master, the illegal value master, and the processing method master. The means for reflecting in the data cleansing process policy master has a step of reflecting the data cleansing process policy of the service infrastructure provider apparatus in the data cleansing process policy master.
前記データクレンジング処理ポリシマスタは、前記データ提供者装置から提供されるデータの元データフィールド名、当該フィールド名のフィールド型属性に生じうる各々の不正値に対応するフィールドの型属性、当該不正値に対する処理方法を含み、
前記不正値は、「空白(NULL)」、「全角半角不統一」、「不正文字」、「異常値」、「ひらがな文字不統一」、「カナ文字不統一」、「英字不統一」、「数値不統一」、「記号不統一」、「漢字文字不統一」、「電話番号非正規化」、「郵便番号非正規化」、「住所非正規化」、「金額非正規化」、の1つ以上であり、
前記フィールドの型属性は、「主キー」、「名前」、「郵便番号」、「住所」、「数量」、「金額」、「日付」、の1つ以上であり、
前記処理方法は、「何もしない」、「レコード全てを削除」、「データ提供者フォーマットに合わせる」、「データ提供者正規化に合わせる」、「空白にする」、「平均値に置き換える」、の1つ以上である
ことを特徴とする。
The data cleansing process policy master includes: an original data field name of data provided from the data provider device; a field type attribute corresponding to each illegal value that may occur in the field type attribute of the field name; and a process for the incorrect value Including methods,
The illegal values are “blank (NULL)”, “full-width half-width inconsistency”, “illegal character”, “abnormal value”, “hiragana character inconsistency”, “kana character inconsistency”, “English letter inconsistency”, “ 1 of "Numeric Ununiformity", "Unidentified Symbol", "Unidentified Kanji Character", "Denormalized Phone Number", "Denormalized Postal Code", "Denormalized Address", "Denormalized Amount" Two or more
The type attribute of the field is one or more of “primary key”, “name”, “zip code”, “address”, “quantity”, “amount”, “date”,
The processing methods are “do nothing”, “delete all records”, “fit to data provider format”, “fit to data provider normalization”, “blank”, “replace with average value”, One or more of the above.
本発明によれば、データ提供者側の数がN者、データ享受者側の数がM者のように数が増えるシステムであっても、データクレンジング処理をシステム的に行える顧客別データクレンジング処理システム及び顧客別データクレンジング処理方法を提供することができる。 According to the present invention, even if the number of data providers is N, and the number of data beneficiaries is M, such as a system in which the number increases, the data cleansing process for each customer can perform the data cleansing process systematically. A system and customer-specific data cleansing processing method can be provided.
また、データクレンジング処理を基盤事業者側の装置に集約して、「データクレンジング処理ポリシマスタ」を保持することにより、データ提供者側は一度「元データ」の「不正値」を指定し、また、データ享受者側は、一度「不正値」に対する「データクレンジング処理ポリシ」を設定すればよい。また、データ提供者用装置や基盤事業者用装置側にて指定されたデータクレンジング処理ポリシに対しても変更したり、追加することができる。 In addition, by consolidating the data cleansing process to the device on the base provider side and holding the “data cleansing process policy master”, the data provider side once designates the “illegal value” of the “original data”, and The data receiver side only needs to set a “data cleansing processing policy” for the “illegal value” once. It can also be changed or added to the data cleansing processing policy designated on the data provider device or the infrastructure provider device side.
上述した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。 Problems, configurations, and effects other than those described above will become apparent from the following description of embodiments.
以下、その実施態様について図面を参照して説明する。まず、サービス享受事業者のビジネスを支援するサービス提供システムの概略について説明する。
サービス提供システムは、アプリケーションサービスやSI、つまり予約機能や業務SaaSなどのサービス(第1のサービスS1)をサービス提供事業者側に提供するサービス基盤事業者システム又は装置(以下、サービス基盤事業者装置と称する)と、サービス享受事業者(飲食店など)の要望に応じて第1のサービスをカスタマイズしてサービス享受事業者に提供するサービス提供事業者システム又は装置(以下、サービス提供事業者装置と称する)と、から構成される。
The embodiment will be described below with reference to the drawings. First, an outline of a service providing system that supports a business of a service receiving business will be described.
The service providing system is a service infrastructure provider system or apparatus (hereinafter referred to as a service infrastructure provider apparatus) that provides an application service or SI, that is, a service (first service S1) such as a reservation function or business SaaS to the service provider. And a service provider system or device (hereinafter referred to as a service provider device) that customizes the first service and provides it to the service receiver in accordance with the request of the service receiver (such as a restaurant). And).
サービス享受事業者(飲食店など)は、ユーザ(消費者)に飲食や商材などを提供し、またユーザからユーザ情報(オリジナル情報)の提供を受ける。 A service receiving business operator (such as a restaurant) provides a user (consumer) with food and drinks and merchandise, and receives user information (original information) from the user.
サービス基盤事業者装置は、SaaS以外、例えばOSを含むプラットフォームを貸し出しするPaaS(Platform as a Service)、ASP(Application Service Provider)サービス等を提供する装置であってもよい。 In addition to SaaS, the service infrastructure provider device may be a device that provides a PaaS (Platform as a Service), an ASP (Application Service Provider) service, or the like that lends a platform including an OS, for example.
以下、飲食業界(飲食店)と、そのサービス提供事業者と、サービス基盤事業者とを主として説明する。
まず、サービス提供システムの概要について説明する。サービス提供システムのサービス基盤事業者装置は、サービス提供事業者装置に対して予約管理サービス(アプリケーションサービス)などを提供するアプリケーションサーバ(以下、サービス基盤事業者用サーバと言う)を有する。
Hereinafter, the restaurant industry (restaurants), service providers, and service infrastructure operators will be mainly described.
First, an outline of the service providing system will be described. The service platform operator apparatus of the service providing system has an application server (hereinafter referred to as a service platform provider server) that provides a reservation management service (application service) or the like to the service provider apparatus.
サービス提供事業者装置は、この予約管理サービスをサービス享受事業者の要望に沿ってカスタマイズし、サービス享受事業者からユーザ(消費者)の予約情報を受付け管理するアプリケーションサーバ(以下、サービス提供事業者用サーバと言う)を有する。つまり、サービス基盤事業者装置とサービス提供事業者装置との協働をもって、サービス享受事業者のビジネスを支援する仕組みである。 The service provider device customizes this reservation management service according to the request of the service receiving provider, and accepts and manages the reservation information of the user (consumer) from the service enjoying provider (hereinafter referred to as the service provider). Server). In other words, this is a mechanism for supporting the business of the service receiving business operator in cooperation with the service infrastructure business operator device and the service providing business operator device.
このような仕組みのシステムは、一般的にサービス享受事業者ごとの個別案件ベースで対応するものである。
従って、サービス基盤事業者装置は、サービス提供事業者装置に対して、第1のサービスS1を提供し、サービス提供事業者装置はサービス享受事業者に対して、カスタマイズした第1のサービス(サービス開始)を提供し、また該提供した第1のサービスに基づくユーザ情報(オリジナル情報)Ia、Ibなどを管理するのみであった。
A system with such a mechanism generally corresponds to an individual project basis for each service receiving company.
Therefore, the service platform operator device provides the first service S1 to the service provider device, and the service provider device provides the customized first service (service start) to the service receiving operator. ) And also manages user information (original information) Ia, Ib, etc. based on the provided first service.
このサービス提供方法としては、例えばSaaSが挙げられる。SaaSとは、情報システム (ソフトウェア) が提供する機能 (第1のサービス) を、サービス提供事業者やサービス享受事業者が、特に新たなシステムを構築・導入することなく、ネットワーク経由で利用することを可能にするICT活用環境である。 An example of this service providing method is SaaS. SaaS means that the function (first service) provided by the information system (software) is used by the service provider and service receiving operator via the network without constructing or introducing a new system. It is an ICT utilization environment that makes possible.
一般的には、SaaSでは、必要なときに必要なサービスを、特別なシステム構築の必要もなく素早く利用できるというメリットがある。また、SaaSでは、社内に特別な環境を用意する必要はないことから、その機能(サービス)の運用開始時間を早め、コストも低減できる。また、インターネットやWANを使用することになるが、ネットワークやブラウザの技術革新により、社内システムを利用するのとほぼ同等の操作が可能である。 In general, SaaS has an advantage that required services can be used quickly without the need for special system construction. In SaaS, it is not necessary to prepare a special environment in the company, so that the operation start time of the function (service) can be advanced and the cost can be reduced. In addition, although the Internet and WAN are used, the operation is almost the same as that using an in-house system due to technological innovation of the network and browser.
また、サービス提供事業者やサービス享受事業者にとっては、サービス基盤事業者から提供されるSaaSやSI及び運用・保守を利用することにより、コスト削減、売上拡大を図ることが期待できる。 In addition, service providers and service users can expect to reduce costs and expand sales by using SaaS, SI, and operation / maintenance provided by service infrastructure providers.
本発明は、斯様なデータ提供事業者の装置(サービス提供事業者装置A、B、サービス享受事業者装置a1、a2、b1、b2など)からのデータをデータマイニングした結果(データ)を、当該データ享受者ごとにデータクレンジング処理し、データクレンジング処理後データとして当該データ享受者の装置側に提供することを可能とするものである。 The present invention provides a result (data) of data mining data from such data provider's devices (service provider devices A, B, service receiving provider devices a1, a2, b1, b2, etc.) Data cleansing processing is performed for each data receiver, and the data can be provided to the device side of the data receiver as post-data cleansing data.
以下、本発明の実施例について図面に基づき説明する。本実施例は、データクレンジング処理が不揃いのデータであっても、受け入れ、例えば、当該受け入れた複数のデータを融合や統合して効率的に分析することを可能とし、また分析データ、或いはオリジナルデータ(元データ)をデータ享受者装置の設定に応じたデータクレンジング処理し、データ享受者側からの配信要求に応じて送信するものである。 Embodiments of the present invention will be described below with reference to the drawings. In the present embodiment, even if the data cleansing process is not complete, it can be accepted, for example, it is possible to efficiently analyze by integrating or integrating the plurality of received data, and the analysis data or original data Data cleansing processing is performed on the (original data) according to the settings of the data receiver device, and is transmitted in response to a distribution request from the data receiver side.
本実施例では、
(1)データ提供者の数がN者、データ享受者の数がM者いる場合、基盤事業者を通してデータの享受を行う。
(2)基盤事業者のサーバ上に、データ提供者の元データに対して、データクレンジング処理する「データクレンジング処理手段」を搭載する。つまり、基盤事業者を中心に本発明のシステムを実装する。
(3)また、基盤事業者のサーバ上に「データクレンジング処理ポリシマスタ」(図14)を持たせる。
(4)「データクレンジング処理ポリシマスタ」(図14)は、デフォルト値として、データ提供者が設定する「デフォルトデータクレンジング処理マスタ」(図12)の値が設定される
(5)データ提供者は、「元データ」(図4)のフィールド毎にフィールドの「属性」を「元データフィールド型属性情報マスタ」(図7)に登録する。「元データ」は「元データソースマスタ」(図2)で管理する
(6)データ提供者は、「元データフィールド型属性情報マスタ」(図7)の中の「フィールド型ID」は「フィールド型属性マスタ」(図8)から選択する。
(7)「フィールド型属性マスタ」(図8)は、網羅的にフィールドの型を準備しておく。もし「フィールド型属性マスタ」に対応する型が無い場合は、データ提供者は「フィールド型属性マスタ」にフィールドの型を追加する。
(8)「不正値」は、「不正値マスタ(図5)」で管理する。「不正値マスタ(図5)」は、網羅的に不正値を準備しておく。もし「不正値マスタ(図5)」に対応する不正値が無い場合は、データ提供者は「不正値マスタ」に不正値を追加する。
(9)不正値の「処理方法」は、「処理方法マスタ」(図10)で管理する。「処理方法マスタ」は、網羅的に処理方法を準備しておく。もし「処理方法マスタ」に対応する処理方法が無い場合は、データ提供者は「処理方法マスタ」(図10)に処理方法を追加する。
(10)データ提供者は、「フィールド型属性」に対する「処理方法」を「データクレンジング処理ポリシ設定画面」(図11)で指定して「デフォルトデータクレンジング処理マスタ」(図12)の各ID(値)を設定する。データ提供者IDはデフォルト値として「0」とする。
(11)「データクレンジング処理ポリシ設定画面」(図11)は、同図に示すように、「不正値」(「空白」、「全角半角不統一」、「不正文字」、「非フォーマット」、・・・)に対するフィールドの型属性(「主キー」、「名前」、「郵便番号」、「住所」、「数量」、「金額」、・・・)の値として「処理ID」を設定する。
(12)データ享受者は、「データクレンジング処理ポリシ設定画面」(図11)をもって「データクレンジング処理ポリシ」を設定できるようにする。設定された「データクレンジング処理ポリシ」は、「データクレンジング処理ポリシマスタ」(図14)に反映する。ここで、データ享受者は「データ享受者マスタ」(図13)で管理される。
(13)「データクレンジング処理ポリシマスタ」(図14)の値は、一度データ享受者により、データの「不正値」に対する処理ポリシ、つまり「処理方法」を設定する。このようにデータ提供者の元データの「不正値」に対して処理ポリシを設定することにより、結果として、データ享受者は一回の処理ポリシ設定で、N者のデータ提供者の元データに対するデータクレンジング処理ポリシを設定することができる。
(14)データ提供者およびデータ享受者は、データ提供者の特定のデータに対するデータクレンジング処理ポリシを設定できる。特定のデータに対するデータクレンジング処理ポリシが設定されている場合には、デフォルトデータクレンジング処理ポリシよりも優先して使用される。
(15)基盤事業者のデータクレンジング処理サーバは、データ提供者側にて指定した「不正値」(図12の不正値ID)に対して、データ享受者の指定した「処理方法」を「データクレンジング処理ポリシマスタ」から読み取って、処理プログラムを実行する。
(16)基盤事業者は、「不正値マスタ」(図9)と「処理方法マスタ」(図10)に対応する処理を実現するプログラムを基盤事業者側のサーバ上に持つ。
以下、その詳細な実施例について説明する。
In this example,
(1) When the number of data providers is N and the number of data beneficiaries is M, data is received through the infrastructure provider.
(2) A “data cleansing processing means” that performs data cleansing processing on the original data of the data provider is mounted on the server of the base provider. In other words, the system of the present invention is implemented mainly by the base business operator.
(3) Also, a “data cleansing process policy master” (FIG. 14) is provided on the server of the base business operator.
(4) “Data Cleansing Process Policy Master” (FIG. 14) is set as a default value by the value of “Default Data Cleansing Process Master” (FIG. 12) set by the data provider. (5) The data provider For each field of “original data” (FIG. 4), the “attribute” of the field is registered in “original data field type attribute information master” (FIG. 7). “Original data” is managed by “original data source master” (FIG. 2). (6) The data provider sets “field type ID” in “original data field type attribute information master” (FIG. 7) to “field”. Select from “Type Attribute Master” (FIG. 8).
(7) The “field type attribute master” (FIG. 8) prepares field types comprehensively. If there is no type corresponding to the “field type attribute master”, the data provider adds the field type to the “field type attribute master”.
(8) “Illegal value” is managed by “Illegal value master (FIG. 5)”. The “illegal value master (FIG. 5)” prepares illegal values comprehensively. If there is no illegal value corresponding to the “illegal value master (FIG. 5)”, the data provider adds an illegal value to the “illegal value master”.
(9) The “processing method” of invalid values is managed by the “processing method master” (FIG. 10). The “processing method master” prepares processing methods comprehensively. If there is no processing method corresponding to the “processing method master”, the data provider adds the processing method to the “processing method master” (FIG. 10).
(10) The data provider designates the “processing method” for the “field type attribute” on the “data cleansing process policy setting screen” (FIG. 11), and each ID of the “default data cleansing process master” (FIG. 12) ( Value). The data provider ID is “0” as a default value.
(11) As shown in FIG. 11, the “data cleansing process policy setting screen” (FIG. 11) includes “illegal value” (“blank”, “double-byte ununiformity”, “illegal character”, “non-format”, "Process ID" is set as the value of the field type attribute ("Primary key", "Name", "Zip code", "Address", "Quantity", "Amount", ...) .
(12) The data receiver can set the “data cleansing process policy” on the “data cleansing process policy setting screen” (FIG. 11). The set “data cleansing process policy” is reflected in the “data cleansing process policy master” (FIG. 14). Here, the data receiver is managed by the “data receiver master” (FIG. 13).
(13) As the value of the “data cleansing process policy master” (FIG. 14), the data receiver once sets the process policy for the “illegal value” of the data, that is, the “processing method”. In this way, by setting the processing policy for the “illegal value” of the data provider's original data, as a result, the data receiver can set the processing policy once for the original data of the N data provider. Data cleansing processing policy can be set.
(14) The data provider and the data receiver can set a data cleansing processing policy for specific data of the data provider. When a data cleansing processing policy is set for specific data, it is used in preference to the default data cleansing processing policy.
(15) The data cleansing processing server of the infrastructure provider sets the “processing method” designated by the data receiver to “data” for the “illegal value” designated on the data provider side (the illegal value ID in FIG. 12). Read from "cleansing process policy master" and execute the processing program.
(16) The platform provider has a program on the server of the platform provider to realize processing corresponding to the “illegal value master” (FIG. 9) and the “processing method master” (FIG. 10).
Hereinafter, the detailed Example is demonstrated.
図1は、本発明の顧客別データクレンジング処理システムをサービス基盤事業者装置に適用したサービス提供システムの全体構成を示す図である。 FIG. 1 is a diagram showing an overall configuration of a service providing system in which a customer-specific data cleansing processing system of the present invention is applied to a service platform operator device.
サービス提供システムは、データ提供事業者のデータ提供事業者装置12、サービス基盤事業者のサービス基盤事業者装置3、を有する。
The service providing system includes a data providing
データ提供事業者装置12は、複数のサービス提供事業者装置(A、B・・・)を含む複数のサービス提供事業者装置2、複数のサービス享受事業者装置(a、b・・・)を含むサービス享受事業者装置1、を有する。
The
データ提供事業者装置12は、データ提供事業者用サーバ121からなる。
各サービス享受事業者装置1は、例えば複数の店舗(a1、a2)や複数の企業(b1、b2)側の装置であって、サービス享受事業者用サーバ11からなる。そして、各サービス享受事業者用サーバ11は、オリジナルユーザ情報、つまり元データ(IaやIb)をサービス提供事業者装置2に対して出力する。
The
Each service receiving
このオリジナルユーザ情報IaやIbは、サービス基盤事業者装置3からネットワーク4を経由して提供する第1のサービスS1(業務/予約機能など)に対応してユーザ側から送られてくるものである。
The original user information Ia and Ib is sent from the user side corresponding to the first service S1 (business / reservation function, etc.) provided from the service
各サービス提供事業者装置2は、サービス提供事業者用サーバ21からなる。サービス提供事業者用サーバ21は、各元データI(Ia、Ib)を受け、当該元データを直接、又はその出所元、つまりユーザが特定できない程度に周知の匿名化技術を利用して匿名化データ(含提供データ=元データI(Ia)、当該データのフィールド型属性情報F(FIa)、及びデータクレンジング処理ポリシC(Ca))としてネットワーク4を介してサービス基盤事業者装置3側に送信する。
Each
サービス基盤事業者装置3は、サービス基盤事業者用サーバ31からなる。サービス基盤事業者用サーバ31は、前記データ提供事業者(A社)用サーバ121から提供されるデータI(Ia)、フィールド型属性情報F(FIa)及びデータクレンジング処理ポリシC(Ca)を受ける。
The service
また、サービス基盤事業者装置3は、データ享受者(P社)用サーバ(図2の1216参照)からデータクレンジング処理ポリシC(Cp)を受ける。
そして、当該データクレンジング処理ポリシに応じて、データ提供者事業者用サーバから提供される元データをデータクレンジング処理し、データクレンジング処理後データSとして出力する機能を有する。
In addition, the service
And according to the said data cleansing process policy, it has a function which performs the data cleansing process of the original data provided from the server for data providers, and outputs it as the data S after a data cleansing process.
図2は、サービス基盤事業者用サーバ31及びデータ提供事業者用サーバ121、データ享受者用サーバ1216の構成を示すブロック図である。 FIG. 2 is a block diagram illustrating the configuration of the service platform provider server 31, the data provider provider server 121, and the data beneficiary server 1216.
本例では、図1のサービス提供事業者用サーバ21をデータ提供者用サーバ121とし、サービス享受事業者用サーバ11をデータ享受者用サーバ1216とし、当該データ提供者用サーバ121からサービス基盤事業者用サーバ31に提供するデータをオリジナルデータ(元データ)I(Ia、Ib、・・・)を前提として説明する。また、データ提供者用サーバ121からのデータをデータクレンジング処理し、当該データクレンジング処理後データSをデータ享受者用サーバ1216に送信することを前提して説明する。
なお、ここで、元データに対して、所望の分析を必要に応じて行ってもよい。また、この分析は、データクレンジング処理後データを元にデータ享受者側にて行なってもよいが、本発明の本質ではないので、その説明は省略する。
In this example, the
Here, a desired analysis may be performed on the original data as necessary. Further, this analysis may be performed on the data receiver side based on the data after the data cleansing process, but since it is not the essence of the present invention, the description thereof is omitted.
データ提供事業者用サーバ121は、元データI、当該データのフィールド型属性を示す情報F及びデータクレンジング処理ポリシC、などをサービス基盤事業者用サーバ31に提供するものであるが、サービス基盤事業者用サーバ31からデータクレンジング処理後データSを享受するデータ享受者用サーバとして利用してもよい。またデータ享受者用サーバ1216は、データクレンジング処理後データSを享受するに際して、データ享受者側のデータクレンジング処理ポリシCpを提供するものであるが、サービス基盤事業者用サーバに対して、データを提供するデータ提供事業者用サーバとして利用してもよい。 The server 121 for the data provider provides the service infrastructure provider server 31 with the original data I, the information F indicating the field type attribute of the data, the data cleansing processing policy C, and the like. You may use as a server for data receivers who receive data S after data cleansing processing from server 31 for users. The data receiver server 1216 provides the data cleansing process policy Cp on the data receiver side when receiving the data S after the data cleansing process. However, the data receiver server 1216 provides data to the service infrastructure provider server. You may utilize as a server for data providers to provide.
データ享受者用サーバ1216が、サービス基盤事業者用サーバ31からデータクレンジング処理後データSを享受するには、サービス基盤事業者用サーバ31に対して、その旨(データ享受要求信号)を要求すると共にデータのデータクレンジング処理ポリシC(Cp)をサービス基盤事業者用サーバ31側に通知する。このデータクレンジング処理ポリシC(Cp)は、予めサービス基盤事業者用サーバ31側に設定登録しておいてもよい。 In order for the data receiver server 1216 to receive the data S after the data cleansing process from the service infrastructure provider server 31, the service infrastructure provider server 31 is requested to that effect (data reception request signal). At the same time, the data cleansing processing policy C (Cp) of the data is notified to the service infrastructure provider server 31 side. The data cleansing processing policy C (Cp) may be set and registered in advance on the service infrastructure provider server 31 side.
サービス基盤事業者用サーバ31は、入出力装置(入出力インターフェース)311、記憶装置(記憶手段)312、演算装置(演算手段)313、を有する。これらはLANにより接続する。 The service infrastructure provider server 31 includes an input / output device (input / output interface) 311, a storage device (storage means) 312, and an arithmetic device (calculation means) 313. These are connected by LAN.
記憶装置312は、データ提供者及びデータ享受者管理マスタDB/データ及びフィールド型属性情報管理DB3121、データ提供者・データ享受者・データクレンジング処理ポリシ情報管理DB3122、フィールド型属性マスタDB3123、不正値マスタDB3124、処理方法マスタDB3125、を有する。
The storage device 312 includes a data provider / data receiver management master DB / data and field type attribute
データ提供者及びデータ享受者管理マスタDB/データ及びフィールド型属性情報管理DB3121は、データ提供者及びデータ享受者のデータやフィールド型属性情報を管理するものであり、またデータ提供者用サーバ121から提供されるデータ及び当該データのフィールド型属性情報をそれぞれ対応付けて記憶し、管理する。
The data provider and data receiver management master DB / data and field type attribute
データ提供者・データ享受者・データクレンジング処理ポリシ情報管理DB3122は、データ提供者やデータ享受者側にて設定されるデータクレンジング処理ポリシ(「データ提供者ID/データ享受者ID」、「元データソースID」、「元データフィールドID」、「元データフィールド名」、「不正値」、「処理方法ID」、など)を記憶する。
Data provider / data beneficiary / data cleansing process policy
換言すれば、データ提供者用サーバ121からの提供データIをサービス基盤事業者用サーバ31にて、データクレンジング処理するデータクレンジング処理ポリシマスタを管理する。 In other words, the data cleansing process policy master that performs the data cleansing process on the provided data I from the data provider server 121 is managed by the service infrastructure provider server 31.
フィールド型属性マスタDB3123は、「フィールド型属性ID」、「属性」、つまり「データ番号」、「購入日」、「店舗名」、「顧客名」「商品名」、「金額」、「購入数」、「日付」などを記憶する。 The field type attribute master DB 3123 stores “field type attribute ID” and “attribute”, that is, “data number”, “purchase date”, “store name”, “customer name” “product name”, “amount”, “number of purchases”. "," Date ", etc. are memorized.
不正値マスタDB3124は、「不正値ID」、「不正値の型」、つまり「空白」、「全角半角不統一」、「不正文字」、「非フォーマット」、などを記録する。
The illegal
処理方法マスタDB3125は、「処理ID」、「処理」、つまり「何もしない」、「レコード全てを削除」、「空白にする」、「平均値に置き換える」、「データ享受者データクレンジング処理ポリシに従う」、「データ享受者のデフォルトデータクレンジング処理ポリシに従う」、「データ提供者データクレンジング処理ポリシに従う」、「基盤事業者データクレンジング処理ポリシに従う」、「データ提供者デフォルトデータクレンジング処理ポリシに従う」、などを記憶する。
これらのDBの内容については後述する。
The processing
The contents of these DBs will be described later.
演算装置313は、元データIをデータクレンジング処理する制御手段3131を有する。
制御手段3131は、データ提供者及びデータ享受者認識部31311、データ及びフィールド型属性情報受信部31312、データクレンジング処理部31313、データクレンジング処理後データ配信部31314、データクレンジング処理ポリシ受信部31315、データ書込み・読出し部31316、などを有する。
The
The control means 3131 includes a data provider and data receiver recognition unit 31131, a data and field type attribute information reception unit 31121, a data
データ提供者及びデータ享受者認識部31311は、データ提供者及びデータ享受者を認識する。 The data provider and data receiver recognition unit 31131 recognizes the data provider and the data receiver.
データ及びフィールド型属性情報受信部31312は、データ提供者用サーバ121からのデータI及びフィールド型属性情報Fを受信する。 The data and field type attribute information receiving unit 31212 receives data I and field type attribute information F from the data provider server 121.
データクレンジング処理ポリシ受信部31315は、データ提供者用サーバ121およびデータ享受者用サーバ1216から提供される元データのデータクレンジング処理ポリシ情報C(Ca、Cp)を受信する。
The data cleansing process
データクレンジング処理部31313は、データ提供者用サーバ121から提供されるデータを、データクレンジング処理ポリシ情報管理DB3122のデータクレンジング処理ポリシに従って、データクレンジング処理する。
The data cleansing
このデータクレンジング処理は、例えば、サービス基盤事業者用サーバ31にて、データ提供者用サーバ121のデータを分析できるようにするためである。
これにより、データ享受者用サーバ1216は、一度、データクレンジング処理して欲しいデータクレンジング処理ポリシを設定するだけで、サービス基盤事業者用サーバ31からデータクレンジング処理後データを享受することができる。
This data cleansing process is performed so that, for example, the service provider server 31 can analyze the data of the data provider server 121.
As a result, the data receiver server 1216 can receive the data after the data cleansing process from the service infrastructure provider server 31 only by setting the data cleansing process policy that the data cleansing process is desired.
データ書込み・読出し部31316は、上述したデータ提供者用サーバの各データI(Ia、Ib、・・)や各データのデータクレンジング処理ポリシC(Ca、Cp)をDB3121に書き込み、当該DBから読み出しする。
The data writing /
データクレンジング処理後データ配信部31315は、データクレンジング処理部31313によりデータクレンジング処理したデータをデータ享受者用サーバ1216に送信する。
The
図3は、サービス基盤事業者用サーバ31の一例を示す機能ブロック図である。同図において、サーバ31は、提供データI及び当該データのフィールド型属性情報Fをデータ及びフィールド型属性情報受信部31312(図2参照)にて受信し、データに対応付けてデータ及びフィールド型属性情報管理DB3121に格納する。
FIG. 3 is a functional block diagram showing an example of the service infrastructure provider server 31. In the figure, the server 31 receives provided data I and field type attribute information F of the data at the data and field type attribute information receiving unit 31212 (see FIG. 2), and associates the data and field type attribute with the data. It is stored in the
提供データIは、データ提供者用サーバ121から提供されるデータフォーマットのままでデータ及びフィールド型属性情報管理DB3121に格納し、その後、データクレンジング処理部31313により、当該データをデータクレンジング処理する。
The provided data I is stored in the data and field type attribute
また、データクレンジング処理部31313により、データクレンジング処理したデータクレンジング処理後データSをデータ及びフィールド型属性情報管理DB3121に格納してもよい。
In addition, the data cleansing
当該データのフィールド型属性情報は、提供データIに対応付けてデータ及びフィールド型属性情報管理DB3121に格納する。
The field type attribute information of the data is stored in the data and field type attribute
以下、各DBのテーブル内容について説明する。
図4は、データ提供者用サーバから提供されるデータ(元データI)の一例を示す図であって、図5の元データマスタのデータ提供者名「かかか商店 株式会社」の元データ名「売上ジャーナルテーブル」を示すテーブルである。
The table contents of each DB will be described below.
FIG. 4 is a diagram illustrating an example of data (original data I) provided from the data provider server, and the original data of the data provider name “Kakaka Shoten Co., Ltd.” in the original data master of FIG. It is a table indicating the name “sales journal table”.
同図において、元データには、元データ主キー(「1」、「2」、「3」、「4」、・・・)、名前(「○田□郎」、「○木□郎」、「○立□郎」、「Jフェリー」、・・・)、郵便番号(「111−1111」、「111112」、「111122」、「111−2222」、・・・)、住所(「札幌市旭区」、「八戸市港町1−1」、「秋田県秋田市」、「盛岡市川辺4丁目」、・・・)、商品名(「xxxx」、「yyyy」、「zzzz」、「Abcde」、・・)、金額(「1000」、「20,000」、「30,000」、「40000」、・・・)、などの各情報401〜406を含んでいる。 In the figure, the original data includes the original data primary key (“1”, “2”, “3”, “4”,...), The name (“○ Da”, “Ogi”). , “○ Tate * ro”, “J Ferry”,...), Postal code (“111-1111”, “111112”, “111122”, “111-2222”,...), Address (“Sapporo Asahi Ward, "1-1, Minatomachi, Hachinohe City," "Akita City, Akita Prefecture," "4-chome Kawabe, Morioka City, ...", product name ("xxxx", "yyyy", "zzz", " Abcde ”,..., And the amount of money (“ 1000 ”,“ 20,000 ”,“ 30,000 ”,“ 40000 ”,...), Etc.
図5は、データ提供者用サーバから提供されるデータ(元データIa)の、サービス基盤事業者用サーバにて準備してある元データマスタを示すテーブルである。 FIG. 5 is a table showing the original data master prepared in the service infrastructure provider server for the data (original data Ia) provided from the data provider server.
同図において、元データソースマスタは、元データID(「1」、「2」、「3」、「4」、・・・)、元データ名(「売上ジャーナルテーブル」、「予約ジャーナルテーブル」、「時間帯別売上テーブル」、「予約ジャーナルテーブル」、・・・)、データ提供者ID(「1」、「2」、「3」、「3」、・・・)、データ提供者名(「かかか商店 株式会社」、「きききホテル 株式会社」、「けけけ美容院 株式会社」、「けけけ美容院 株式会社」、・・・)、などの各情報501〜504を含んでいる。 In the drawing, the original data source master includes an original data ID (“1”, “2”, “3”, “4”,...), An original data name (“sales journal table”, “reserved journal table”). , “Sales table by time zone”, “Reservation journal table”,...), Data provider ID (“1”, “2”, “3”, “3”,...), Data provider name (“Kakaka Shoten Co., Ltd.”, “Kikiki Hotel Co., Ltd.”, “Keke Hair Salon Co., Ltd.”, “Keke Hair Salon Co., Ltd.”, etc.) It is out.
図6は、サービス基盤事業者用サーバにおけるデータ提供者(A社)マスタを示すテーブルである。 FIG. 6 is a table showing a data provider (Company A) master in the service infrastructure provider server.
同図において、データ提供者マスタは、データ提供者ID(「1」、「2」、「3」、・・・、データ提供者名(「株式会社 さささ製作所」、「有限会社 ししし製麺」、「株式会社 すすす商事」、・・・)、などの各情報601〜602を含んでいる。
In this figure, the data provider master has a data provider ID (“1”, “2”, “3”,..., Data provider name (“Sasa Co., Ltd.” Each
図7は、データ提供者用サーバから提供されるデータの、サービス基盤事業者用サーバにて準備してある元データフィールド型属性マスタを示すテーブルである。 FIG. 7 is a table showing an original data field type attribute master prepared in the service infrastructure provider server for data provided from the data provider server.
同図において、元データフィールド型属性マスタは、フィールドID(「1」、「2」、「3」、「4」、「5」、「6」、「7」、・・・)、元データID(「1」、「1」、「1」、「1」、「1」、「1」、「1」、・・・)フィールド名(「データ番号」、「購入日」、「店舗名」、「顧客名」、「商品名」、「購入数」、「金額」、・・・)、フィールド型属性ID(「1」、「8」、「3」、「3」、「3」、「7」、「6」、・・・)、などの各情報701〜704を含んでいる。 In the figure, the original data field type attribute master includes a field ID (“1”, “2”, “3”, “4”, “5”, “6”, “7”,...), Original data. ID (“1”, “1”, “1”, “1”, “1”, “1”, “1”,...) Field name (“data number”, “purchase date”, “store name” ”,“ Customer name ”,“ product name ”,“ number of purchases ”,“ money amount ”,...), Field type attribute IDs (“ 1 ”,“ 8 ”,“ 3 ”,“ 3 ”,“ 3 ”) , “7”, “6”,...) And the like.
図8は、データ提供者用サーバから提供されるデータのフィールド型属性マスタを示すテーブルである。 FIG. 8 is a table showing a field type attribute master of data provided from the data provider server.
同図において、フィールド型属性マスタは、フィールド型属性ID(「1」、「2」、「3」、「4」、「5」、「6」、「7」、「8」、・・・)、属性(「データ番号」、「購入日」、「店舗名」、「顧客名」、「商品名」、「金額」、「購入数」、「日付」、・・・)などの各情報801〜802を含んでいる。 In the figure, the field type attribute master includes field type attribute IDs (“1”, “2”, “3”, “4”, “5”, “6”, “7”, “8”,... ), Attributes ("data number", "purchase date", "store name", "customer name", "product name", "money", "number of purchases", "date", etc.) 801-802 are included.
図9サービス基盤事業者用サーバにて網羅的に準備してある不正値マスタを示すテーブルである。
同図において、不正値マスタは、不正値ID(「1」、「2」、「3」、「4」、・・・)、不正値の型(「空白」、「全角半角不統一」、「不正文字」、「非正規化」、・・・)などの各情報901〜902を含んでいる。
9 is a table showing an illegal value master that is comprehensively prepared in the server for service infrastructure providers.
In the figure, the illegal value master includes an illegal value ID (“1”, “2”, “3”, “4”,...), An illegal value type (“blank”, “unmatched one-byte / half-width”, Each
図10サービス基盤事業者用サーバにて網羅的に準備してある処理方法マスタを示すテーブルである。 10 is a table showing a processing method master that is comprehensively prepared in the server for service infrastructure providers.
同図において、処理方法マスタは、処理方法ID(「1」、「2」、「3」、「4」、「5」、「6」、「7」、「8」、「9」、・・・)、処理(「何もしない」、「レコード全てを削除」、「空白にする」、「平均値に置き換える」、「データ享受者データクレンジング処理ポリシに従う⇒P社データクレンジング処理ポリシCpIa」、「データ享受者のデフォルトデータクレンジング処理ポリシに従う⇒P社デフォルトデータクレンジング処理ポリシCp」、「データ提供者のデータクレンジング処理ポリシに従う⇒A社元データIa用A社データクレンジング処理ポリシCaIa」、「基盤事業者データクレンジング処理ポリシに従う⇒基盤事業者デフォルトデータクレンジング処理ポリシCq」、「データ提供者のデフォルトデータクレンジング処理ポリシに従う⇒A社デフォルトデータクレンジング処理ポリシCa」、・・・)、などの各情報1001〜1002を含んでいる。 In this figure, the processing method master has processing method IDs (“1”, “2”, “3”, “4”, “5”, “6”, “7”, “8”, “9”,. ..), processing ("do nothing", "delete all records", "blank", "replace with average value", "follow data beneficiary data cleansing process policy ⇒ Company P data cleansing process policy CpIa" , “According to data receiver default data cleansing process policy ⇒ P company default data cleansing process policy Cp”, “According to data provider data cleansing process policy ⇒ A company data cleansing process policy CaIa for company A original data Ia”, “ According to the infrastructure provider data cleansing policy ⇒ Infrastructure provider default data cleansing policy Cq ”,“ Default default of data provider ⇒A company default data cleansing process policy Ca "according to the data cleansing process policy, ...) includes the information 1001-1002 and the like.
図11はサービス享受者用サーバにて、データクレンジング処理ポリシを設定するデータクレンジング処理ポリシ設定画面を示す図である。 FIG. 11 is a diagram showing a data cleansing process policy setting screen for setting a data cleansing process policy on the service beneficiary server.
同図において、データクレンジング処理ポリシ設定画面には、横方向にフィールド名703(図7参照)の「データ番号」7031、「購入日」7032、「店舗名」7033、「顧客名」7034、「商品名」7035、「購入日」7036、「金額」7037、及び当該フィールド名のフィールド型属性の「主キー」7041’、「日付」7042’、「名前」7043’、「名前」7044’、「名前」7045’、「数量」7046’、「金額」7047’などが表示される。
また、縦方向には、「不正値」(図9参照)の「空白」、「全角半角不統一」、「不正文字」、「非フォーマット」、などが表示される。
そして、「不正値」に対応する「フィールド型属性」は、セレクトボックスをもって、処理方法〈図10参照〉の処理ID(1〜9、・・・)を設定する。
In the figure, the data cleansing process policy setting screen has a “data number” 7031, “purchase date” 7032, “store name” 7033, “customer name” 7034, “field name” 703 (see FIG. 7) in the horizontal direction. “Product Name” 7035, “Purchase Date” 7036, “Amount” 7037, and “Primary Key” 7041 ′, “Date” 7042 ′, “Name” 7043 ′, “Name” 7044 ′ of the field type attribute of the field name, “Name” 7045 ′, “Quantity” 7046 ′, “Price” 7047 ′, and the like are displayed.
In the vertical direction, “blank”, “full-width half-width inconsistency”, “illegal character”, “non-format”, etc., are displayed.
Then, in the “field type attribute” corresponding to “illegal value”, the processing ID (1 to 9,...) Of the processing method <see FIG.
図12は、データ提供者(A社)のデータ(Ia)デフォルトデータクレンジング処理ポリシマスタの例を示す図である。 FIG. 12 is a diagram illustrating an example of a data provider (company A) data (Ia) default data cleansing process policy master.
同図において、デフォルトデータクレンジング処理ポリシマスタは、データ提供者ID(「1」、「1」、「1」、「1」、・・・)、元データソースID(「1」、「1」、「1」、「1」、・・・)、元データフィールドID(「1」・・・、「2」・・・、「3」・・・、「4」・・・、・・・)、元データフィールド名(「元データキー」・・・、「名前」・・・、「郵便番号」・・・、「住所」、・・・)、不正値ID(「1」、「2」、「3」、「4」、「1」、「2」、「3」、「4」、「1」、「2」、「3」、「4」・・・)、処理方法ID(「2」、「2」、「2」、「2」、「1」、「1」、「3」、「3」、「1」、「5」、「3」、「3」、「1」、「5」、「5」、「3」)、などの各情報1201〜1206を含んでいる。 In the figure, the default data cleansing process policy master includes a data provider ID (“1”, “1”, “1”, “1”,...), An original data source ID (“1”, “1”, "1", "1", ...), original data field ID ("1" ..., "2" ..., "3" ..., "4" ..., ...) , Original data field name ("original data key" ..., "name" ..., "zip code" ..., "address", ...), illegal value ID ("1", "2") , “3”, “4”, “1”, “2”, “3”, “4”, “1”, “2”, “3”, “4”...), Processing method ID (“ “2”, “2”, “2”, “2”, “1”, “1”, “3”, “3”, “1”, “5”, “3”, “3”, “1” , “5”, “5”, “3”), etc. Which comprise.
図13は、サービス基盤事業者用サーバにおけるデータ享受者(P社)マスタの例を示す図である。 FIG. 13 is a diagram illustrating an example of a data beneficiary (Company P) master in the service infrastructure provider server.
同図において、データ享受者マスタは、データ享受者ID(「1」、「2」、「3」、・・・、データ享受者名(「株式会社 さささ製作所」、「有限会社 ししし製麺」、「株式会社 すすす商事」、・・・)、などの各情報1301〜1302を含んでいる。
In this figure, the data beneficiary master is the data beneficiary ID (“1”, “2”, “3”,..., The data beneficiary name (“Sasa Manufacturing Co., Ltd.” Each
図14サービス基盤事業者用サーバにおけるデータクレンジング処理ポリシマスタの例を示す図である。 14 is a diagram showing an example of a data cleansing processing policy master in the service infrastructure provider server.
同図において、データクレンジング処理ポリシマスタは、データ享受者ID(「1」、「1」、「1」、「1」、・・・)、元データソースID(「1」、「1」、「1」、「1」、・・・)、元データフィールドID(「1」・・・、「2」・・・、「3」・・・、「4」・・・、・・・)、元データフィールド名(「元データキー」・・・、「名前」・・・、「郵便番号」・・・、「住所」、・・・)、不正値ID(「1」、「2」、「3」、「4」、「1」、「2」、「3」、「4」、「1」、「2」、「3」、「4」・・・)、処理方法ID(「2」、「2」、「2」、「2」、「1」、「1」、「3」、「3」、「1」、「5」、「3」、「3」、「1」、「5」、「5」、「3」)、などの各情報1401〜1406を含んでいる。 In the figure, the data cleansing processing policy master includes a data receiver ID (“1”, “1”, “1”, “1”,...), An original data source ID (“1”, “1”, “ 1), “1”,...), Original data field ID (“1”..., “2”..., “3”..., “4”...), Original data field name ("original data key" ..., "name" ..., "zip code" ..., "address", ...), illegal value ID ("1", "2", “3”, “4”, “1”, “2”, “3”, “4”, “1”, “2”, “3”, “4”...), Processing method ID (“2”) ”,“ 2 ”,“ 2 ”,“ 2 ”,“ 1 ”,“ 1 ”,“ 3 ”,“ 3 ”,“ 1 ”,“ 5 ”,“ 3 ”,“ 3 ”,“ 1 ”, “5”, “5”, “3”), etc. .
次に、顧客別データクレンジング処理方法の処理手順について説明する。
図15は、本発明の顧客別データクレンジング処理方法の処理フローを説明する図である。本例では、データ提供者用サーバ121が2つの場合を示し、データ享受者用サーバ1216が1つの場合を示している。また、各者のデフォルトデータクレンジング処理ポリシは設定済みとし、かつフィールド型属性マスタ、不正値マスタ、処理方法マスタがデータ提供者用サーバおよびデータ享受者用サーバに共有されているものとする。図において以下の処理を実行する。
(1)データ提供者(A社)は、上述した3つのマスタを元にデータIa用フィールド型属性情報FIa、およびデータIa用A社データクレンジング処理ポリシCaIaを作成する。
(2)そして、データ提供者(A社)は、基盤事業者に対して、データIa&フィールド型属性情報FIa、およびデータIa用A社データクレンジング処理ポリシCaIaを送信する。
(3)データ提供者(B社)も、上記(2)、(3)と同様な処理を行う。
(4)データ享受者(P社)は、基盤事業者に対して、データIaのフィールド型属性情報FIa、およびデータIa用A社データクレンジング処理ポリシCaIaを要求する。
(5)基盤事業者は、この要求に応答し、データ享受者(P社)に対して、データ提供者〈A社〉のデータIaのフィールド型属性情報FIa、およびデータIa用A社データクレンジング処理ポリシCaIaを送信する。
(6)データ享受者(P社)は、FIa、CaIaを受信し、これらを参照して、データIa用データクレンジング処理ポリシCpIaを作成し、基盤事業者に送信する。
(7)また、データ享受者(P社)は、基盤事業者に対して、データクレンジング処理後データを要求する。
(8)基盤事業者は、この要求を元にデータクレンジング処理を実行し、データクレンジング処理後データをサービス享受者(P社)に送信する。
(9)サービス享受事業者(P社)は、このデータクレンジング処理後データを受信する。
Next, the processing procedure of the customer-specific data cleansing processing method will be described.
FIG. 15 is a diagram illustrating a processing flow of the customer-specific data cleansing processing method of the present invention. In this example, the case where the number of data provider servers 121 is two is shown, and the case where the number of data receiver servers 1216 is one is shown. In addition, it is assumed that the default data cleansing processing policy of each person has been set, and the field type attribute master, the invalid value master, and the processing method master are shared by the data provider server and the data receiver server. In the figure, the following processing is executed.
(1) The data provider (Company A) creates the field type attribute information FIa for data Ia and the data cleansing processing policy CaIa for company I for data Ia based on the above-described three masters.
(2) Then, the data provider (Company A) transmits the data Ia & field type attribute information FIa and the data A data cleansing processing policy CaIa for the data Ia to the base provider.
(3) The data provider (Company B) also performs the same processing as (2) and (3) above.
(4) The data beneficiary (Company P) requests the field provider from the field type attribute information FIa of the data Ia and the company A data cleansing processing policy CaIa for the data Ia.
(5) In response to this request, the base business operator responds to the data beneficiary (Company P) with the field type attribute information FIa of the data provider <Company A> data Ia, and the data cleansing data for Company A for data Ia. The processing policy CaIa is transmitted.
(6) The data beneficiary (Company P) receives FIa and CaIa, creates a data cleansing processing policy CpIa for data Ia with reference to these, and transmits it to the base business operator.
(7) Moreover, the data beneficiary (Company P) requests the data after the data cleansing process from the base company.
(8) The infrastructure provider executes the data cleansing process based on this request, and transmits the data after the data cleansing process to the service user (Company P).
(9) The service receiving company (Company P) receives the data after the data cleansing process.
データ提供者(A社)用サーバ121は、ステップS1211にて、データIa及び当該データのフィールド型属性FIaをサービス基盤事業者用サーバ31に送信する。 In step S1211, the data provider (company A) server 121 transmits the data Ia and the field type attribute FIa of the data to the service infrastructure provider server 31.
また、別のデータ提供者(B社)用サーバ121は、同様にステップS1212にて、データIb及び当該データのフィールド型属性FIbをサービス基盤事業者用サーバ31に送信する。 Further, another data provider (company B) server 121 similarly transmits the data Ib and the field type attribute FIb of the data to the service infrastructure provider server 31 in step S1212.
一方、データ享受者(P社)用サーバ1216は、ステップS12161にて、サービス基盤事業者用サーバ31に対して、データクレンジング処理したデータ(データクレンジング処理後データ)の享受を要求すると共にデータクレンジング処理ポリシCpを送信する。 On the other hand, in step S12161, the data beneficiary (P company) server 1216 requests the service infrastructure provider server 31 to receive data cleansed data (data after cleansing process) and performs data cleansing. The processing policy Cp is transmitted.
サービス基盤事業者用サーバ31は、ステップS311にて、これらのデータIa,Ib及びフィールド型属性情報FIa、FIbを受信処理し、データ及びフィールド型属性情報管理DB3121に書き込み、格納する。
また、ステップS315にて、データ享受者(P社)用サーバ1216からの要求に応答し、データ享受者(P社)に対して、データ提供者〈A社〉のデータIaのフィールド型属性情報FIa、およびデータIa用A社データクレンジング処理ポリシCaIaを送信する。
In step S311, the service infrastructure provider server 31 receives the data Ia and Ib and the field type attribute information FIa and FIb, and writes and stores them in the data and field type attribute
In step S315, in response to a request from the server 1216 for the data beneficiary (P company), the field type attribute information of the data Ia of the data provider <Company A> is sent to the data beneficiary (P company). FIa and A company data cleansing processing policy CaIa for data Ia are transmitted.
また、ステップS312にて、データ要求及びデータクレンジング処理ポリシCpを受信し、データ提供者及びデータ享受者データクレンジング処理ポリシ情報管理DB3122に書き込み、格納する。
In step S312, the data request and data cleansing process policy Cp is received, and written and stored in the data provider and data beneficiary data cleansing process policy
次に、ステップS313にて、データクレンジング処理ポリシ情報管理DB3122のデータクレンジング処理ポリシCpに従った処理方法を元にデータクレンジング処理を行う。このデータクレンジング処理ポリシCpに従ったデータクレンジング処理は、元データ毎に行う。
Next, in step S313, data cleansing processing is performed based on a processing method according to the data cleansing processing policy Cp of the data cleansing processing policy
また、このデータクレンジング処理は、必要に応じて、データ提供者側にて設定したデフォルトデータクレンジング処理ポリシCa、データ提供者データ用デフォルトデータクレンジング処理ポリシCaIa、又は基盤事業者側にて設定した基盤事業者データクレンジング処理ポリシCg、或いはデータ提供者にて設定したデータ提供者用デフォルトデータクレンジング処理ポリシCaIaに対して、データ享受者側にて一部変更設定した享受者データクレンジング処理ポリシCpIaにて行ってもよい。 In addition, the data cleansing process is performed as necessary by the default data cleansing process policy Ca set by the data provider side, the default data cleansing process policy CaIa for data provider data, or the base set by the base provider side. In the provider data cleansing process policy CpIa partially changed on the data receiver side for the provider data cleansing process policy Cg or the data provider default data cleansing process policy CaIa set by the data provider You may go.
しかるのち、ステップS314にて、データ提供者用サーバ121からの提供データ(元データ)Iaをデータクレンジング処理したデータクレンジング処理後データをデータ享受者用サーバ121に対して送信する。 Thereafter, in step S314, the data cleansing-processed data obtained by performing the data cleansing process on the provision data (original data) Ia from the data provider server 121 is transmitted to the data receiver server 121.
このとき、図示してないが、必要に応じて、データ提供者用サーバ121からのデータのデータフォーマットをサービス基盤事業者用サーバ31のデータクレンジング処理ポリシに従ったデータフォーマットに変換処理し、統一の基盤データフォーマットのデータを所望の分析手法(データマイニング)により、データ分析処理する。あるいは、基盤データフォーマットのまま、あるいはデータ提供者用サーバ121のデータフォーマットのままであってもよい。これらは、データ享受者用サーバ1216からのデータフォーマット形式要求に応じてなされる。 At this time, although not illustrated, the data format of the data from the data provider server 121 is converted into a data format according to the data cleansing processing policy of the service infrastructure provider server 31 and unified as necessary. The data in the basic data format is subjected to data analysis processing by a desired analysis method (data mining). Alternatively, the basic data format or the data format of the data provider server 121 may be used. These are made in response to a data format request from the data receiver server 1216.
データ享受者用サーバ1216は、ステップS12162にて、データクレンジング処理結果データを受信する。 Data receiver server 1216 receives data cleansing process result data in step S12162.
これにより、データ享受者側のデータクレンジング処理ポリシを反映し、当該データ享受者側の希望するデータクレンジング処理データを享受することができる。 Thereby, the data cleansing process policy on the data receiver side can be reflected and the data cleansing process data desired on the data receiver side can be received.
図16は、データ提供者(A社)側から基盤事業者側に対して提供する元データ、フィールド型属性およびデータクレンジング処理ポリシを送信する流れを模式的に示した図である。 FIG. 16 is a diagram schematically showing a flow of transmitting original data, field type attributes, and data cleansing processing policy provided from the data provider (Company A) side to the base provider side.
同図において、データ提供者(A社)側は、まず、基盤事業者側の記憶装置からフィールド型属性マスタ(図8参照)、不正値マスタ(図9参照)、処理方法マスタ(図10参照)、を取り込む。そして、これらを元にA社デフォルトデータクレンジング処理ポリシCaを作成し、基盤事業者側に送信する。 In this figure, the data provider (Company A) first starts from the storage device on the base provider side with a field type attribute master (see FIG. 8), an illegal value master (see FIG. 9), and a processing method master (see FIG. 10). ). And A company default data cleansing process policy Ca is created based on these, and it transmits to the base | substrate provider side.
また、A社から提供するA社元データIaを基盤事業者側に送信する。このとき、A社元データIaと基盤事業者側から取り込んだフィールド型属性マスタ(図8参照)、不正値マスタ(図9参照)、処理方法マスタ(図10参照)を元にA社元データIaのフィールド型属性FIaおよびA社データIa用デフォルトデータクレンジング処理ポリシCaIa、を作成し、基盤事業者側に送信する。 Further, the company A original data Ia provided from the company A is transmitted to the platform provider side. At this time, A company original data based on A company original data Ia and the field type attribute master (see FIG. 8), illegal value master (see FIG. 9), and processing method master (see FIG. 10) taken in from the platform operator side. The field type attribute FIa of Ia and the default data cleansing processing policy CaIa for the company A data Ia are created and transmitted to the infrastructure provider side.
基盤事業者側は、A社デフォルトデータクレンジング処理ポリシCa、A社元データIa、A社元データIaのフィールド型属性FIa(図8参照)およびA社データIa用デフォルトデータクレンジング処理ポリシCaIaを受信し、これらを記憶装置のデータクレンジング処理ポリシ情報管理DB31323に格納する(図12参照)。 The base company receives the A company default data cleansing processing policy Ca, the A company original data Ia, the field type attribute FIa of the A company original data Ia (see FIG. 8), and the default data cleansing processing policy CaIa for the A company data Ia. These are stored in the data cleansing process policy information management DB 31323 of the storage device (see FIG. 12).
図17は、データ享受者(P社)側から基盤事業者に対してデータクレンジング処理ポリシを送信し、また基盤事業者側からデータ享受者側に対して、データクレンジング処理されたデータを送信する流れを模式的に示した図である。 FIG. 17 transmits a data cleansing process policy from the data beneficiary (Company P) side to the base provider, and transmits data cleansed data from the base provider side to the data beneficiary side. It is the figure which showed the flow typically.
同図において、データ享受者(P社)側は、まず、基盤事業者側の記憶装置からフィールド型属性マスタ(図8参照)、不正値マスタ(図9参照)、処理方法マスタ(図10参照)を取り込む。そして、これらを元にP社デフォルトデータクレンジング処理ポリシCpを作成し、基盤事業者側に送信する。 In this figure, the data beneficiary (Company P) first starts from the storage device on the base provider side with a field type attribute master (see FIG. 8), an illegal value master (see FIG. 9), and a processing method master (see FIG. 10). ). And P company default data cleansing process policy Cp is created based on these, and it transmits to the base | substrate provider side.
また、データ提供者(A社)側で作成したA社元データIa、A社元データIaのフィールド型属性FIa、A社元データIa用A社データクレンジング処理ポリシCaIa、を基盤事業者側の記憶装置から取り込む。 In addition, the data provider (company A) side creates the company A original data Ia, the field type attribute FIa of the company A original data Ia, and the company A data cleansing processing policy CaIa for the company A original data Ia. Import from storage.
そして、A社元データIaに対して、A社データIa用デフォルトデータクレンジング処理ポリシCaIaに変更を加えたい場合、つまりデータ享受者側の意志による処理ポリシを設定する場合には、データ享受者(P社)側から所望のデータクレンジング処理ポリシCpIaを設定し、基盤事業者側に送信する。例えば、基盤事業者側から取り込んだA社元データIaのフィールド型属性情報FIa及びA社元データIa用A社データクレンジング処理ポリシを参照し、A社元データIa用P社データクレンジング処理ポリシを作成し、当該作成ポリシを基盤事業者側のデータクレンジング処理マスタに反映し、当該ポリシをもってデータクレンジング処理を行えるようにする。 Then, when it is desired to change the default data cleansing processing policy CaIa for the A company data Ia with respect to the A company original data Ia, that is, when setting the processing policy according to the intention of the data receiver side, the data receiver ( A desired data cleansing process policy CpIa is set from the P company) side and transmitted to the platform provider side. For example, with reference to the field type attribute information FIa of the A company original data Ia and the A company data cleansing processing policy for the A company original data Ia, which is imported from the base company side, the P company data cleansing processing policy for the A company original data Ia is Create and reflect the created policy on the data cleansing process master on the base provider side so that the data cleansing process can be performed with the policy.
このデータクレンジング処理ポリシ設定は、例えば、図10に示すようなデータクレンジング処理設定画面をもって行なう。 This data cleansing process policy setting is performed, for example, using a data cleansing process setting screen as shown in FIG.
基盤事業者側は、データ享受者(P社)側からのP社デフォルトデータクレンジング処理ポリシCp、A社元データIa用P社データクレンジング処理ポリシCpIaを受信する。そして、これらの処理ポリシを元に、又はA社元Ia用A社データクレンジング処理ポリシCaIa、基盤事業者デフォルトデータクレンジング処理ポリシCg、A社デフォルトデータクレンジング処理ポリシCaをもって、A社元データIaに対して、データクレンジング処理を行う。 The base company side receives the P company default data cleansing process policy Cp and the P company data cleansing process policy CpIa for the A company original data Ia from the data beneficiary (P company) side. And based on these processing policies, or A company data cleansing process policy CaIa for A company company Ia, base company default data cleansing process policy Cg, A company default data cleansing process policy Ca, and A company company data Ia On the other hand, data cleansing processing is performed.
しかるのち、所望のフォーマット変換処理、所望の分析を行い、その結果データをデータ享受者(P社)側に送信する。 Thereafter, desired format conversion processing and desired analysis are performed, and the result data is transmitted to the data receiver (Company P).
図18は、データ享受者側と基盤事業者側との間におけるデータクレンジング処理ポリシ設定画面の表示生成するためのフローチャートである。同図において、データ享受者側は、ステップS1111にて、基盤事業者側の「不正値マスタ」から不整値一覧を取得し、ステップS1112にて、不正値を「データクレンジング処理ポリシ設定画面」(図11参照)の縦軸に表示する。 FIG. 18 is a flowchart for generating a display of a data cleansing process policy setting screen between the data beneficiary and the infrastructure provider. In the figure, the data beneficiary side obtains an irregular value list from the “illegal value master” on the platform operator side in step S1111 and in step S1112, the illegal value is displayed in the “data cleansing process policy setting screen” ( It is displayed on the vertical axis of FIG.
また、ステップS1113にて、「フィールド型属性マスタ」(図8参照)からフィールド型属性一覧を取得し、ステップS1114にて、フィールド型属性の値を「データクレンジング処理ポリシ設定画面」の横軸に表示する。 In step S1113, a field type attribute list is acquired from the “field type attribute master” (see FIG. 8). In step S1114, the field type attribute value is displayed on the horizontal axis of the “data cleansing process policy setting screen”. indicate.
ステップS3115にて、「処理方法マスタ」から処理方法一覧を取得し、ステップS1116にて、当該処理方法の値を「データクレンジング処理ポリシ設定画面」の値欄で選択可能に表示する。 In step S3115, a processing method list is acquired from the “processing method master”, and in step S1116, the value of the processing method is displayed so as to be selectable in the value column of the “data cleansing processing policy setting screen”.
ステップS1117にて、データ享受者側では、「データクレンジング処理ポリシ設定画面」で各「フィールド型属性」の各「不正値」に対する「処理方法」を設定し、ステップS3118にて、当該設定した「処理方法」を基盤事業者(サーバ)側に送信する。
基盤事業者側は、基盤事業者側からの「処理方法」を受け、当該「処理方法」を元に、ステップS3119にて、「データクレンジング処理ポリシマスタ」を作成し、記憶装置に記憶する。
In step S1117, the data receiver sets a “processing method” for each “illegal value” of each “field type attribute” on the “data cleansing processing policy setting screen”, and in step S3118, the set “ "Processing method" is sent to the platform provider (server) side.
The infrastructure provider side receives the “processing method” from the infrastructure provider side, creates a “data cleansing processing policy master” in step S3119 based on the “processing method”, and stores it in the storage device.
図19は、データ提供者側と基盤事業者側との間におけるデータクレンジング処理ポリシ設定画面の表示生成するためのフローチャートである。 FIG. 19 is a flowchart for displaying and generating a data cleansing process policy setting screen between the data provider side and the base provider side.
同図において、データ提供者側(データ提供者A社)は、ステップS1121にて、基盤事業者側から「フィールド型属性マスタ」、「不正値マスタ」、「処理方法」マスタを取り込む。 In the figure, the data provider side (data provider company A) takes in the “field type attribute master”, “incorrect value master”, and “processing method” master from the base provider side in step S1121.
基盤事業者側は、ステップS1122にて、「フィールド型属性情報マスタ」、「不正値マスタ」、「処理方法マスタ」から「データクレンジング処理ポリシ設定画面」を利用して「基盤事業者データクレンジング処理ポリシCg」を設定する。 In step S1122, the platform operator side uses the “data cleansing process policy setting screen” from the “field type attribute information master”, “illegal value master”, and “processing method master” to execute the “platform provider data cleansing process”. Policy Cg ”is set.
データ提供者A社は、ステップS1123にて、「フィールド型属性情報マスタ」「不正値マスタ」「処理方法マスタ」から「データクレンジング処理ポリシ設定画面」を利用して「A社デフォルトデータクレンジング処理ポリシCa」を設定する。 In step S 1123, the data provider A uses the “data cleansing process policy setting screen” from the “field type attribute information master”, “illegal value master”, and “processing method master” to “A company default data cleansing process policy”. “Ca” is set.
データ提供者A社は、ステップS1124にて、基盤事業者に「A社元データIa」を送信する。 In step S1124, the data provider A transmits “A company original data Ia” to the platform provider.
データ提供者A社は、ステップS1125にて、基盤事業者に「A社元データIa」の「フィールド型属性情報型FIa」を送信する。 In step S1125, the data provider A transmits “field type attribute information type FIa” of “A company original data Ia” to the base company.
データ提供者A社は、ステップS1126にて、「A社デフォルトデータクレンジング処理ポリシCa」を参考にして、「A社データIa用デフォルトデータクレンジング処理ポリシCaIa」を設定する。 In step S1126, the data provider A sets “default data cleansing processing policy CaIa for company A data Ia” with reference to “company A default data cleansing processing policy Ca”.
データ提供者A社は、ステップS1127にて、基盤事業者に「A社データIa用デフォルトデータクレンジング処理ポリシCaIa」を送信する。 In step S1127, the data provider A transmits “default data cleansing processing policy CaIa for company A data Ia” to the base company.
図20〜図26は、データクレンジング処理ポリシの作成からデータクレンジング処理までの一手順例を示すフローチャートである。 20 to 26 are flowcharts showing an example of a procedure from creation of a data cleansing process policy to data cleansing process.
図20において、データ享受者P社は、ステップS1411にて、基盤事業者から「フィールド型属性情報マスタ」、「不正値マスタ」、「処理方法マスタ」を取り込み、「データクレンジング処理ポリシ設定画面」を利用して「P社デフォルトデータクレンジング処理ポリシCp」を作成して、基盤事業者に送信する。 In FIG. 20, the data beneficiary company P imports “field type attribute information master”, “illegal value master”, and “processing method master” from the base provider in step S1411, and “data cleansing processing policy setting screen”. Is used to create “P company default data cleansing policy Cp” and send it to the base operator.
データ享受者P社は、ステップS1412にて、基盤事業者から「A社データIa用フィールド型属性FIa」及び「A社データIa用データクレンジング処理ポリシCaIa」を取り込む。 In step S1412, the data beneficiary company P fetches “field type attribute FIa for company A data Ia” and “data cleansing processing policy CaIa for company A data Ia” from the base company.
データ享受者P社は、ステップS1413にて、「A社データIa用フィールド型属性FIa」及び「A社データIa用データクレンジング処理ポリシCaIa」を参照して「データクレンジング処理ポリシ設定画面」を利用して「A社元データIa用P社データクレンジング処理ポリシCpIa」を作成して、基盤事業者に送信する。 In step S1413, the data receiver P uses the “data cleansing process policy setting screen” with reference to “field type attribute FIa for company A data Ia” and “data cleansing process policy CaIa for company A data Ia”. Then, “Company P data cleansing processing policy CpIa for company A original data Ia” is created and transmitted to the base operator.
しかる後、図21の*1へ進む。同図において、ステップS1421にて、データIaのレコード数iは、1からレコード数に達するまで(i≦レコード数〉処理を実行し、ステップS1422にて、データIaのレコードiにおけるフィールドjは、1からフィールド数まで(j≦フィールド数)処理を実行し、ステップS1423に進み、当該ステップにて、フィールド(i、j)は不正値か否かを判定する。 Thereafter, the process proceeds to * 1 in FIG. In the figure, in step S1421, the number of records i of data Ia is processed until i reaches the number of records (i ≦ number of records). In step S1422, the field j in the record i of data Ia is The processing from 1 to the number of fields (j ≦ number of fields) is executed, and the process proceeds to step S1423, where it is determined whether or not the field (i, j) is an illegal value.
その結果、不正値の場合(Y)は、ステップS1424に進み、当該ステップにて、A社元データIa用P社データクレンジング処理ポリシCpIaの有無を判定する。
不正値で無い場合(N)は、ステップS1430に進み、後述する処理を行う。
As a result, in the case of an invalid value (Y), the process proceeds to step S1424, and in this step, the presence / absence of the P company data cleansing processing policy CpIa for the A company original data Ia is determined.
If it is not an illegal value (N), the process proceeds to step S1430, and a process described later is performed.
当該ステップS1424にて、CpIaが有る場合は、図25の*0へ進み、後述する図10の処理方法に従った処理を実行する。CpIaが無い場合は、ステップS1425へ進み、当該ステップにて、A社データIa用データクレンジング処理ポリシCaIaの有無を判定する。 If CpIa is present in step S1424, the process proceeds to * 0 in FIG. 25, and processing according to the processing method in FIG. If there is no CpIa, the process proceeds to step S1425, and in this step, the presence / absence of the data cleansing processing policy CaIa for company A data Ia is determined.
当該ステップS1425にて、CaIaが有る場合は、図23の*7outへ進み、後述する図10の処理方法に従った処理を実行する。CaIaが無い場合は、ステップS1426に進み、当該ステップにて、P社デフォルトデータクレンジング処理ポリシCpの有無を判定する。 If CaIa is present in step S1425, the process proceeds to * 7out in FIG. 23, and processing according to the processing method in FIG. If there is no CaIa, the process proceeds to step S1426, and the presence or absence of the P company default data cleansing processing policy Cp is determined in this step.
当該ステップにて、Cpが有る場合は、図24の6outへ進み、後述する図10の処理方法に従った処理を実行する。Cpが無い場合は、ステップS1427に進み、当該ステップにて、A社デフォルトデータクレンジング処理ポリシCaの有無を判定する。 If Cp is present in this step, the process proceeds to 6out in FIG. 24, and processing according to the processing method in FIG. If there is no Cp, the process proceeds to step S1427, and the presence / absence of the company A default data cleansing processing policy Ca is determined in this step.
当該ステップにて、Caが有る場合は、図25の*9outへ進み、後述する図10の処理方法に従った処理を実行する。Caが無い場合は、ステップ1428に進み、当該ステップにて、基盤事業者デフォルトデータクレンジング処理ポリシCgの有無を判定する。 If Ca is present in this step, the process proceeds to * 9out in FIG. 25, and processing according to the processing method in FIG. If there is no Ca, the process proceeds to step 1428, where the presence / absence of the base provider default data cleansing processing policy Cg is determined.
当該ステップにて、Cgが有る場合は、図26の*8outへ進み、後述する図10の処理方法に従った処理を実行する。Cgが無い場合は、*100へ戻り、ステップS1430にて、jに1を追加(j=j+1)し、ステップS1431にて、iに1を追加(i+1)し、処理を終了する。 If Cg is present in this step, the process proceeds to * 8out in FIG. 26, and processing according to the processing method in FIG. If there is no Cg, the process returns to * 100, 1 is added to j (j = j + 1) in step S1430, 1 is added to i (i + 1) in step S1431, and the process ends.
次に、図22〜図26において、図10の処理方法に従った処理について説明する。
図21のステップS1424にて、CpIaが有る場合は、図22において、ステップS14241にて、図14の処理ポリシを参照し、処理方法IDを取得する。
Next, processing according to the processing method of FIG. 10 will be described with reference to FIGS.
If CpIa is present in step S1424 in FIG. 21, in step S14241 in FIG. 22, the processing policy in FIG. 14 is referred to and a processing method ID is acquired.
次に、ステップS14242にて、処理方法IDが1、2、3、4、5の何れで有るか無いかを判定する。ここで、ID=1、ID=2、ID=3、ID=4、ID=5で有る場合(Y)は、図21の*4に戻り、ステップS1429にて、処理方法IDに従った処理を実行する。また、上述したステップS1430、S1431を経て処理を終了する。 Next, in step S14242, it is determined whether the processing method ID is 1, 2, 3, 4, or 5. Here, if ID = 1, ID = 2, ID = 3, ID = 4, and ID = 5 (Y), the process returns to * 4 in FIG. 21, and the process according to the process method ID is performed in step S1429. Execute. In addition, the process ends through the above-described steps S1430 and S1431.
図22のステップS14243にて、ID=1、ID=2、ID=3、ID=4、ID=5で無い場合(N)は、ステップS14243に進み、当該ステップにて、処理方法IDがID=7で有るか無いかを判定する。 When ID = 1, ID = 2, ID = 3, ID = 4, and ID = 5 are not satisfied in step S14243 in FIG. 22 (N), the process proceeds to step S14243, and in this step, the processing method ID is ID. It is determined whether or not = 7.
ここで、処理方法ID=7で有る場合(Y)は、図21の*7inに戻り、上述した処理を実行する。処理方法ID=7で無い場合(N)は、ステップS14244に進み、当該ステップにて、処理方法IDがID=6で有るか無いかを判定する。 If the processing method ID is 7 (Y), the process returns to * 7 in FIG. 21 and the above-described processing is executed. If the processing method ID is not 7 (N), the process proceeds to step S14244, and in this step, it is determined whether the processing method ID is ID = 6.
ここで、処理方法ID=6で有る場合(Y)は、図21の*6inに戻り、上述した処理を実行する。処理方法ID=6で無い場合(N)は、ステップS14245に進み、当該ステップにて、処理方法IDがID=9で有るか無いかを判定する。 If the processing method ID = 6 (Y), the process returns to * 6 in FIG. 21 and the above-described processing is executed. If the processing method ID is not 6 (N), the process proceeds to step S14245, and in this step, it is determined whether the processing method ID is ID = 9.
ここで、処理方法ID=9で有る場合(Y)は、図21の*9inに戻り、上述した処理を実行する。処理方法ID=9で無い場合(N)は、ステップS14246に進み、当該ステップにて、処理方法ID=8で有るか無いかを判定する。 If the processing method ID is 9 (Y), the process returns to * 9 in FIG. 21 and the above-described processing is executed. When the processing method ID is not 9 (N), the process proceeds to step S14246, where it is determined whether the processing method ID is 8 or not.
ここで、処理方法ID=8で有る場合(Y)は、図21の*8inに戻り、上述した処理を実行する。処理方法ID=8で無い場合(N)は、処理を終了する。 If the processing method ID is 8 (Y), the process returns to * 8 in in FIG. 21 and the above-described processing is executed. When the processing method ID is not 8 (N), the processing is terminated.
図21のステップS1425にて、CaIaが有る場合は、図23において、ステップS14251にて、図14の処理ポリシを参照し、処理方法IDを取得する。 In step S1425 of FIG. 21, if CaIa is present, in FIG. 23, the processing policy ID is acquired with reference to the processing policy of FIG. 14 in step S14251.
次に、ステップS14252にて、処理方法IDが1、2、3、4、5の何れで有るか無いかを判定する。ここで、ID=1、ID=2、ID=3、ID=4、ID=5で有る場合(Y)は、図21の*4に戻り、ステップS1429にて、処理方法IDに従った処理を実行する。また、上述したステップS1430、S1431を経て処理を終了する。 Next, in step S14252, it is determined whether the processing method ID is 1, 2, 3, 4, or 5. Here, if ID = 1, ID = 2, ID = 3, ID = 4, and ID = 5 (Y), the process returns to * 4 in FIG. 21, and the process according to the process method ID is performed in step S1429. Execute. In addition, the process ends through the above-described steps S1430 and S1431.
ID=1、ID=2、ID=3、ID=4、ID=5で無い場合(N)は、ステップS14254に進み、当該ステップにて、処理方法IDがID=6で有るか無いかを判定する。 If ID = 1, ID = 2, ID = 3, ID = 4, and ID = 5 are not satisfied (N), the process proceeds to step S14254, and whether or not the processing method ID is ID = 6 in this step. judge.
ここで、処理方法ID=6で有る場合(Y)は、図21の*6inに戻り、上述した処理を実行する。処理方法ID=6で無い場合(N)は、ステップS14255に進み、当該ステップにて、処理方法IDがID=9で有るか無いかを判定する。 If the processing method ID = 6 (Y), the process returns to * 6 in FIG. 21 and the above-described processing is executed. If the processing method ID is not 6 (N), the process advances to step S14255 to determine whether or not the processing method ID is ID = 9.
ここで、処理方法ID=9で有る場合(Y)は、図21の*9inに戻り、上述した処理を実行する。処理方法ID=9で無い場合(N)は、ステップS14256に進み、当該ステップにて、処理方法ID=8で有るか無いかを判定する。 If the processing method ID is 9 (Y), the process returns to * 9 in FIG. 21 and the above-described processing is executed. If the processing method ID is not 9 (N), the process advances to step S14256 to determine whether or not the processing method ID is 8 in this step.
ここで、処理方法ID=8で有る場合(Y)は、図21の*8inに戻り、上述した処理を実行する。処理方法ID=8で無い場合(N)は、処理を終了する。 If the processing method ID is 8 (Y), the process returns to * 8 in in FIG. 21 and the above-described processing is executed. When the processing method ID is not 8 (N), the processing is terminated.
図21のステップS1426にて、Cpが有る場合は、図24において、ステップS14261にて、図14ポリシを参照し、処理方法IDを取得する。 If Cp is present in step S1426 of FIG. 21, the processing method ID is acquired in step S14261 in FIG. 24 with reference to the policy in FIG.
次に、ステップS14262にて、処理方法IDが1、2、3、4、5の何れで有るか無いかを判定する。ここで、ID=1、ID=2、ID=3、ID=4、ID=5で有る場合(Y)は、図21の*4に戻り、ステップS1429にて、処理方法IDに従った処理を実行する。また、上述したステップS1430、S1431を経て処理を終了する。 Next, in step S14262, it is determined whether the processing method ID is 1, 2, 3, 4, or 5. Here, if ID = 1, ID = 2, ID = 3, ID = 4, and ID = 5 (Y), the process returns to * 4 in FIG. 21, and the process according to the process method ID is performed in step S1429. Execute. In addition, the process ends through the above-described steps S1430 and S1431.
ID=1、ID=2、ID=3、ID=4、ID=5で無い場合(N)は、ステップS14265に進み、当該ステップにて、処理方法IDがID=9で有るか無いかを判定する。 If ID = 1, ID = 2, ID = 3, ID = 4, and ID = 5 are not satisfied (N), the process proceeds to step S14265, and whether or not the processing method ID is ID = 9 in this step. judge.
ここで、処理方法ID=9で有る場合(Y)は、図21の*9inに戻り、上述した処理を実行する。処理方法ID=9で無い場合(N)は、ステップS14266に進み、当該ステップにて、処理方法ID=8で有るか無いかを判定する。 If the processing method ID is 9 (Y), the process returns to * 9 in FIG. 21 and the above-described processing is executed. If the processing method ID is not 9 (N), the process proceeds to step S14266, and it is determined whether or not the processing method ID is 8 in this step.
ここで、処理方法ID=8で有る場合(Y)は、図21の*8inに戻り、上述した処理を実行する。処理方法ID=8で無い場合(N)は、処理を終了する。 If the processing method ID is 8 (Y), the process returns to * 8 in in FIG. 21 and the above-described processing is executed. When the processing method ID is not 8 (N), the processing is terminated.
図21のステップS1427にて、Caが有る場合は、図25において、ステップS14271にて、図14ポリシを参照し、処理方法IDを取得する。 In step S1427 in FIG. 21, if Ca is present, in FIG. 25, in step S14271, the policy in FIG. 14 is referred to and the processing method ID is acquired.
次に、ステップS14272にて、処理方法IDが1、2、3、4、5の何れで有るか無いかを判定する。ここで、ID=1、ID=2、ID=3、ID=4、ID=5で有る場合(Y)は、図21の*4に戻り、ステップS1429にて、処理方法IDに従った処理を実行する。また、上述したステップS1430、S1431を経て処理を終了する。 Next, in step S14272, it is determined whether the processing method ID is 1, 2, 3, 4, or 5. Here, if ID = 1, ID = 2, ID = 3, ID = 4, and ID = 5 (Y), the process returns to * 4 in FIG. 21, and the process according to the process method ID is performed in step S1429. Execute. In addition, the process ends through the above-described steps S1430 and S1431.
ID=1、ID=2、ID=3、ID=4、ID=5で無い場合(N)は、ステップS14275に進み、当該ステップにて、処理方法IDがID=8で有るか無いかを判定する。 If ID = 1, ID = 2, ID = 3, ID = 4, and ID = 5 are not satisfied (N), the process proceeds to step S14275, and whether or not the processing method ID is ID = 8 is determined in this step. judge.
ここで、処理方法ID=8で有る場合(Y)は、図21の*8inに戻り、上述した処理を実行する。処理方法ID=8で無い場合(N)は、処理を終了する。 If the processing method ID is 8 (Y), the process returns to * 8 in in FIG. 21 and the above-described processing is executed. When the processing method ID is not 8 (N), the processing is terminated.
図21のステップS1428にて、Cgが有る場合は、図29において、ステップS14281にて、図14ポリシを参照し、処理方法IDを取得する。 If Cg is present in step S1428 of FIG. 21, the processing method ID is acquired in step S14281 with reference to the policy of FIG. 14 in FIG.
次に、ステップS14282にて、処理方法IDが1、2、3、4、5の何れで有るか無いかを判定する。ここで、ID=1、ID=2、ID=3、ID=4、ID=5で有る場合(Y)は、図21の*4に戻り、ステップS1429にて、処理方法IDに従った処理を実行する。また、上述したステップS1430、S1431を経て処理を終了する。 Next, in step S14282, it is determined whether the processing method ID is 1, 2, 3, 4, or 5. Here, if ID = 1, ID = 2, ID = 3, ID = 4, and ID = 5 (Y), the process returns to * 4 in FIG. 21, and the process according to the process method ID is performed in step S1429. Execute. In addition, the process ends through the above-described steps S1430 and S1431.
ID=1、ID=2、ID=3、ID=4、ID=5で無い場合(N)は、図21の*100へ戻り、上述した処理を行って終了する。 When ID = 1, ID = 2, ID = 3, ID = 4, and ID = 5 are not satisfied (N), the process returns to * 100 in FIG.
なお、本発明は上述した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。 In addition, this invention is not limited to the Example mentioned above, Various modifications are included. For example, the above-described embodiments have been described in detail for easy understanding of the present invention, and are not necessarily limited to those having all the configurations described. Further, a part of the configuration of one embodiment can be replaced with the configuration of another embodiment, and the configuration of another embodiment can be added to the configuration of one embodiment. Further, it is possible to add, delete, and replace other configurations for a part of the configuration of each embodiment.
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク等の記録装置に置くことができる。 Each of the above-described configurations, functions, processing units, processing means, and the like may be realized by hardware by designing a part or all of them with, for example, an integrated circuit. Each of the above-described configurations, functions, and the like may be realized by software by interpreting and executing a program that realizes each function by the processor. Information such as programs, tables, and files for realizing each function can be stored in a recording device such as a memory or a hard disk.
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。 Further, the control lines and information lines indicate what is considered necessary for the explanation, and not all the control lines and information lines on the product are necessarily shown. Actually, it may be considered that almost all the components are connected to each other.
1 サービス享受事業者装置
2 サービス提供事業者装置
3 サービス基盤事業者装置
31 基盤事業者用サーバ
311 入出力装置(入出力インターフェース手段)
312 記憶装置(記憶手段)
313 演算装置(制御手段)
121 サービス提供事業者用サーバ
31 サービス基盤事業者用サーバ
121 データ提供者用サーバ
1216 データ享受者用サーバ
3121 データ提供事業者及びデータ享受者マスタDB/データ及びフィールド型属性情報管理DB
3122 データ提供者&データ享受者データクレンジング処理ポリシ情報管理マスタDB
3123 フィールド型属性マスタDB
3124 不正値マスタDB
3125 処理方法マスタDB
31311 データ提供者&データ享受者認識部
31312 データ&フィールド型属性情報受信部
31313 データクレンジング処理部
31314 データクレンジング処理後データ配信部
31315 データクレンジング処理ポリシ受信部
31316 データ書込み・読出し部
DESCRIPTION OF
312 Storage device (storage means)
313 Arithmetic unit (control means)
121 service provider server 31 service infrastructure provider server 121 data provider server 1216
3122 Data Provider & Data Receiver Data Cleansing Process Policy Information Management Master DB
3123 Field type attribute master DB
3124 Invalid value master DB
3125 Processing Method Master DB
31311 Data provider & data receiver recognition unit 3112 Data & field type attribute
Claims (9)
前記サービス基盤事業者装置は、
入出力手段、記憶手段、制御手段、を有し、
前記入出力手段は、
前記データ提供者装置及び前記データ享受者装置との間でデータの授受を行い、
前記記憶手段は、前記データ提供者装置から提供されるデータに対するデータクレンジング処理ポリシマスタを有し、
前記制御手段は、前記データクレンジング処理ポリシマスタのデータクレンジング処理ポリシをもって、前記データのデータクレンジング処理を行う機能を有し、
前記データ提供者装置から提供されるデータ、及び当該データのフィールド型属性情報を受信する受信部と、
前記データクレンジング処理ポリシを受信するデータクレンジング処理ポリシ受信部と、
前記データクレンジング処理ポリシに従って、前記データ提供者装置から提供されるデータをデータクレンジング処理するデータクレンジング処理手段と、
前記データクレンジング処理手段にてデータクレンジング処理した後のデータクレンジング処理後データを前記データ享受者装置に送信する手段と、
を有することを特徴とする顧客別データクレンジング処理システム。 A data providing system having at least one service infrastructure company device, a plurality of data provider devices, and a plurality of data receiver devices,
The service platform operator device is:
Input / output means, storage means, control means,
The input / output means includes
Send and receive data between the data provider device and the data beneficiary device,
The storage means includes a data cleansing process policy master for data provided from the data provider device,
The control means has a function of performing a data cleansing process of the data with a data cleansing process policy of the data cleansing process policy master,
A receiving unit that receives data provided from the data provider device and field type attribute information of the data;
A data cleansing process policy receiving unit for receiving the data cleansing process policy;
Data cleansing processing means for performing data cleansing processing on data provided from the data provider device according to the data cleansing processing policy;
Means for transmitting the data cleansing data after the data cleansing processing by the data cleansing processing means to the data receiver device;
A customer-specific data cleansing processing system.
前記制御手段は、更に、
前記データ享受者装置のデフォルトデータクレンジング処理ポリシ、前記データ提供者装置から提供されるデータ用のデータ享受者データクレンジング処理ポリシ、及び前記データ提供者装置のデフォルトデータクレンジング処理ポリシ、前記データ提供者装置から提供されるデータ用のデータ提供者データクレンジング処理ポリシを受信し、前記データクレンジング処理ポリシマスタに反映する手段、
を有することを特徴とする顧客別データクレンジング処理システム。 In the customer-specific data cleansing processing system according to claim 1,
The control means further includes
Default data cleansing processing policy of the data receiver device, data receiver data cleansing processing policy for data provided from the data provider device, default data cleansing processing policy of the data provider device, and the data provider device Means for receiving a data provider data cleansing processing policy for data provided from and reflecting the data on the data cleansing processing policy master;
A customer-specific data cleansing processing system.
前記制御手段は、更に、
フィールド型属性マスタ、不正値マスタ、処理方法マスタ、を有し、当該フィールド型属性マスタ、不正値マスタ、処理方法マスタ、から前記サービス基盤事業者装置のデータクレンジング処理ポリシを作成する手段を有し、前記データクレンジング処理ポリシマスタに反映する手段は、前記サービス基盤事業者装置のデータクレンジング処理ポリシを前記データクレンジング処理ポリシマスタに反映する
ことを特徴とする顧客別データクレンジング処理システム。 In the customer-specific data cleansing processing system according to claim 2,
The control means further includes
A field type attribute master, an illegal value master, a processing method master, and a means for creating a data cleansing processing policy for the service infrastructure provider device from the field type attribute master, the illegal value master, and the processing method master. The means for reflecting in the data cleansing process policy master reflects the data cleansing process policy of the service infrastructure provider apparatus in the data cleansing process policy master.
前記データクレンジング処理ポリシマスタは、前記データ提供者装置から提供されるデータの元データフィールド名、当該フィールド名のフィールド型属性に生じうる各々の不正値に対応する処理方法を含み、
前記不正値は、「空白(NULL)」、「全角半角不統一」、「不正文字」、「異常値」、「ひらがな文字不統一」、「カナ文字不統一」、「英字不統一」、「数値不統一」、「記号不統一」、「漢字文字不統一」、「電話番号非正規化」、「郵便番号非正規化」、「住所非正規化」、「金額非正規化」、の1つ以上であり、
前記フィールドの型属性は、「主キー」、「名前」、「郵便番号」、「住所」、「数量」、「金額」、「日付」、の1つ以上であり、
前記処理方法は、「何もしない」、「レコード全てを削除」、「データ提供者フォーマットに合わせる」、「データ提供者正規化に合わせる」、「空白にする」、「平均値に置き換える」、の1つ以上である
ことを特徴とする顧客別データクレンジング処理システム。 In the customer-specific data cleansing processing system according to claim 1,
The data cleansing process policy master includes an original data field name of data provided from the data provider device, a processing method corresponding to each illegal value that may occur in the field type attribute of the field name,
The illegal values are “blank (NULL)”, “full-width half-width inconsistency”, “illegal character”, “abnormal value”, “hiragana character inconsistency”, “kana character inconsistency”, “English letter inconsistency”, “ 1 of "Numeric Ununiformity", "Unidentified Symbol", "Unidentified Kanji Character", "Denormalized Phone Number", "Denormalized Postal Code", "Denormalized Address", "Denormalized Amount" Two or more
The type attribute of the field is one or more of “primary key”, “name”, “zip code”, “address”, “quantity”, “amount”, “date”,
The processing methods are “do nothing”, “delete all records”, “fit to data provider format”, “fit to data provider normalization”, “blank”, “replace with average value”, A customer-specific data cleansing processing system characterized by being one or more of the following.
前記基盤事業者装置は、
前記データ提供者用装置からの元データをデータクレンジング処理するデータクレンジング処理制御装置及び前記元データの各フィールドに生じうる不正値を定義する不正値マスタ、前記元データの各フィールドに生じうる不正値に対する処理方法を有するデータクレンジング処理ポリシマスタを有し、
前記データ提供者用装置は、
前記元データに対して、当該データの値が不正値の場合、当該不正値が前記不正値マスタのどの項目に対応するかを指定する手段を有し、
前記データ享受者用装置は、
前記元データに対して網羅的に準備したフィールド型属性型に対して、不正値に対する処理ポリシを設定する手段を有し、
前記データクレンジング処理制御装置は、
前記データ提供者用装置側にて設定した元データのフィールド型属性情報に対して、前記データ享受者用装置側にて設定した処理ポリシを前記データクレンジング処理ポリシマスタから読み取る読取手段と、当該読み取ったデータクレンジング処理ポリシに従って前記元データをデータクレンジング処理する処理する制御手段と、を有する
ことを特徴とする顧客別データクレンジング処理システム。 Receives the original data provided from the provider's device for data providers, and includes a base provider device that provides the original data to the data receiver device, and data sharing data among multiple providers In customer-specific data cleansing processing system for cleansing processing,
The infrastructure provider device is
A data cleansing processing control device that performs data cleansing processing on original data from the data provider device, an illegal value master that defines an illegal value that can occur in each field of the original data, and an illegal value that can occur in each field of the original data A data cleansing processing policy master having a processing method for
The data provider device comprises:
When the value of the data is an illegal value with respect to the original data, there is means for specifying which item of the illegal value master the illegal value corresponds to,
The data receiver device is:
Means for setting a processing policy for illegal values for field type attribute types prepared comprehensively for the original data;
The data cleansing process control device includes:
Reading means for reading the processing policy set on the data receiver device side from the data cleansing processing policy master for the field type attribute information of the original data set on the data provider device side, and the reading A customer-specific data cleansing processing system, comprising: control means for performing data cleansing processing on the original data in accordance with a data cleansing processing policy.
前記サービス基盤事業者装置は、
入出力手段、記憶手段、制御手段、を有し、
前記入出力手段は、
前記データ提供者装置及び前記データ享受者装置との間でデータの授受を行い、
前記記憶手段は、前記データ提供者装置から提供されるデータに対するデータクレンジング処理ポリシマスタを有し、
前記制御手段は、前記データクレンジング処理ポリシマスタのデータクレンジング処理ポリシをもって、前記データのデータクレンジング処理を行う機能を有し、
前記データ提供者装置から提供されるデータ、及び当該データのフィールド型属性情報を受信するステップと、
前記データクレンジング処理ポリシマスタのデータクレンジング処理ポリシを受信するステップと、
前記データクレンジング処理ポリシに従って、前記データ提供者装置から提供されるデータをデータクレンジング処理するステップと、
前記データクレンジング処理手段にてデータクレンジング処理した後のデータクレンジング処理後データを前記データ享受者装置に送信するステップと、
を有することを特徴とする顧客別データクレンジング処理方法。 A data cleansing processing method for each customer in a data providing system having at least one service infrastructure provider device, a plurality of data provider devices, and a plurality of data receiver devices,
The service platform operator device is:
Input / output means, storage means, control means,
The input / output means includes
Send and receive data between the data provider device and the data beneficiary device,
The storage means includes a data cleansing process policy master for data provided from the data provider device,
The control means has a function of performing a data cleansing process of the data with a data cleansing process policy of the data cleansing process policy master,
Receiving data provided from the data provider device and field type attribute information of the data;
Receiving a data cleansing process policy of the data cleansing process policy master;
Performing data cleansing processing on data provided from the data provider device according to the data cleansing processing policy;
Transmitting data cleansing-processed data after data cleansing processing by the data cleansing processing means to the data receiver device;
A customer-specific data cleansing processing method.
前記制御手段は、更に、
前記データ享受者装置のデフォルトデータクレンジング処理ポリシ、前記データ提供者装置から提供されるデータ用のデータ享受者データクレンジング処理ポリシ、及び前記データ提供者装置のデフォルトデータクレンジング処理ポリシ、前記データ提供者装置から提供されるデータ用のデータ提供者用データクレンジング処理ポリシを受信し、前記データクレンジング処理ポリシマスタに反映するステップ、
を有することを特徴とする顧客別データクレンジング処理方法。 In the customer-specific data cleansing processing method according to claim 6,
The control means further includes
Default data cleansing processing policy of the data receiver device, data receiver data cleansing processing policy for data provided from the data provider device, default data cleansing processing policy of the data provider device, and the data provider device Receiving a data cleansing process policy for data provider for data provided from and reflecting it on the data cleansing process policy master;
A customer-specific data cleansing processing method.
前記制御手段は、更に、
フィールド型属性マスタ、不正値マスタ、処理方法マスタ、を有し、当該フィールド型属性マスタ、不正値マスタ、処理方法マスタ、から前記サービス基盤事業者装置のデータクレンジング処理ポリシを作成するステップを有し、前記データクレンジング処理ポリシマスタに反映する手段は、前記サービス基盤事業者装置のデータクレンジング処理ポリシを前記データクレンジング処理ポリシマスタに反映するステップを有する
ことを特徴とする顧客別データクレンジング処理システム。 In the customer-specific data cleansing processing system according to claim 7,
The control means further includes
A field type attribute master, an illegal value master, a processing method master, and a step of creating a data cleansing processing policy for the service infrastructure provider device from the field type attribute master, the illegal value master, and the processing method master. The means for reflecting in the data cleansing process policy master has a step of reflecting the data cleansing process policy of the service infrastructure provider device in the data cleansing process policy master. The customer-specific data cleansing process system.
前記データクレンジング処理ポリシマスタは、前記データ提供者装置から提供されるデータの元データフィールド名、当該フィールド名のフィールド型属性に生じうる各々の不正値に対応するフィールドの型属性、当該不正値に対する処理方法を含み、
前記不正値は、「空白(NULL)」、「全角半角不統一」、「不正文字」、「異常値」、「ひらがな文字不統一」、「カナ文字不統一」、「英字不統一」、「数値不統一」、「記号不統一」、「漢字文字不統一」、「電話番号非正規化」、「郵便番号非正規化」、「住所非正規化」、「金額非正規化」、の1つ以上であり、
前記フィールドの型属性は、「主キー」、「名前」、「郵便番号」、「住所」、「数量」、「金額」、「日付」、の1つ以上であり、
前記処理方法は、「何もしない」、「レコード全てを削除」、「データ提供者フォーマットに合わせる」、「データ提供者正規化に合わせる」、「空白にする」、「平均値に置き換える」、の1つ以上である
ことを特徴とする顧客別データクレンジング処理方法。 In the customer-specific data cleansing processing method according to claim 6,
The data cleansing process policy master includes: an original data field name of data provided from the data provider device; a field type attribute corresponding to each illegal value that may occur in the field type attribute of the field name; and a process for the incorrect value Including methods,
The illegal values are “blank (NULL)”, “full-width half-width inconsistency”, “illegal character”, “abnormal value”, “hiragana character inconsistency”, “kana character inconsistency”, “English letter inconsistency”, “ 1 of "Numeric Ununiformity", "Unidentified Symbol", "Unidentified Kanji Character", "Denormalized Phone Number", "Denormalized Postal Code", "Denormalized Address", "Denormalized Amount" Two or more
The type attribute of the field is one or more of “primary key”, “name”, “zip code”, “address”, “quantity”, “amount”, “date”,
The processing methods are “do nothing”, “delete all records”, “fit to data provider format”, “fit to data provider normalization”, “blank”, “replace with average value”, A customer-specific data cleansing processing method, characterized by being one or more of the following.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013073930A JP2014199504A (en) | 2013-03-29 | 2013-03-29 | Customer specific data cleansing processing system and customer specific data cleansing processing method |
PCT/JP2013/070075 WO2014155761A1 (en) | 2013-03-29 | 2013-07-24 | Customer-specific data cleansing processing system and customer-specific data cleansing processing method |
SG11201401593PA SG11201401593PA (en) | 2013-03-29 | 2013-07-24 | Customer-specific data cleansing processing system and customer-specific data cleansing processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013073930A JP2014199504A (en) | 2013-03-29 | 2013-03-29 | Customer specific data cleansing processing system and customer specific data cleansing processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014199504A true JP2014199504A (en) | 2014-10-23 |
JP2014199504A5 JP2014199504A5 (en) | 2016-05-26 |
Family
ID=51622804
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013073930A Pending JP2014199504A (en) | 2013-03-29 | 2013-03-29 | Customer specific data cleansing processing system and customer specific data cleansing processing method |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP2014199504A (en) |
SG (1) | SG11201401593PA (en) |
WO (1) | WO2014155761A1 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106407266B (en) * | 2016-08-25 | 2019-12-31 | 中广核工程有限公司 | Three-dimensional calculation result formatting extraction method and device |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10293704A (en) * | 1997-04-18 | 1998-11-04 | Hitachi Ltd | Information processor collecting and managing log data |
JP2006039961A (en) * | 2004-07-27 | 2006-02-09 | Carlex Co Ltd | Sales support device, sales support method, sales support system and program |
JP2008090855A (en) * | 2000-10-11 | 2008-04-17 | Malik M Hasan | System for communication of healthcare data |
JP2008537266A (en) * | 2005-04-20 | 2008-09-11 | ザ・ボーイング・カンパニー | Adaptive data cleaning |
US20100179945A1 (en) * | 2009-01-15 | 2010-07-15 | Bmc Software, Inc. | Normalization Engine to Manage Configuration Management Database Integrity |
JP2010244539A (en) * | 2009-04-07 | 2010-10-28 | Business Objects Software Ltd | System and method of data cleansing using rule based formatting |
JP2010262587A (en) * | 2009-05-11 | 2010-11-18 | Fujitsu Ltd | Program, method and apparatus for converting data |
US20120023142A1 (en) * | 2010-07-23 | 2012-01-26 | Donato Diorio | Data Normalizer |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5810719B2 (en) * | 2011-07-29 | 2015-11-11 | 富士通株式会社 | Data arrangement changing program, data arrangement changing method, and data arrangement changing apparatus |
-
2013
- 2013-03-29 JP JP2013073930A patent/JP2014199504A/en active Pending
- 2013-07-24 WO PCT/JP2013/070075 patent/WO2014155761A1/en active Application Filing
- 2013-07-24 SG SG11201401593PA patent/SG11201401593PA/en unknown
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10293704A (en) * | 1997-04-18 | 1998-11-04 | Hitachi Ltd | Information processor collecting and managing log data |
JP2008090855A (en) * | 2000-10-11 | 2008-04-17 | Malik M Hasan | System for communication of healthcare data |
JP2006039961A (en) * | 2004-07-27 | 2006-02-09 | Carlex Co Ltd | Sales support device, sales support method, sales support system and program |
JP2008537266A (en) * | 2005-04-20 | 2008-09-11 | ザ・ボーイング・カンパニー | Adaptive data cleaning |
US20100179945A1 (en) * | 2009-01-15 | 2010-07-15 | Bmc Software, Inc. | Normalization Engine to Manage Configuration Management Database Integrity |
JP2010244539A (en) * | 2009-04-07 | 2010-10-28 | Business Objects Software Ltd | System and method of data cleansing using rule based formatting |
JP2010262587A (en) * | 2009-05-11 | 2010-11-18 | Fujitsu Ltd | Program, method and apparatus for converting data |
US20120023142A1 (en) * | 2010-07-23 | 2012-01-26 | Donato Diorio | Data Normalizer |
Also Published As
Publication number | Publication date |
---|---|
WO2014155761A1 (en) | 2014-10-02 |
SG11201401593PA (en) | 2014-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190333074A1 (en) | System and method for interacting with a social network | |
KR101687927B1 (en) | Obtaining event reviews | |
US20140201331A1 (en) | Platform for the delivery of content and services to networked connected computing devices | |
US9659106B2 (en) | Software application customized for target market | |
US20130030909A1 (en) | Customizable social campaigns | |
EP2915120A1 (en) | Electronic publishing mechanisms | |
WO2014028129A2 (en) | Detecting and transmitting a redeemable document | |
US20140288980A1 (en) | Mobile solution for venues and teams to increase their seat revenue | |
US10747728B2 (en) | Edit and share unsupported files through instantly generated preview | |
JP2015018342A (en) | Electronic correspondence device and program | |
Pawar et al. | Developing an Improvised E-Menu Recommendation System for Customer | |
US9880985B2 (en) | Revision of a portion of a document via social media | |
WO2014091788A1 (en) | Customer-specific, data-format-converted-data provision system, and customer-specific, data-format-converted-data provision method | |
US20160110766A1 (en) | System and method of displaying social ads along with organic or paid search results | |
CN113254016A (en) | Interface generation method, interface information processing method, equipment and storage medium | |
US10324975B2 (en) | Bulk keyword management application | |
WO2014155761A1 (en) | Customer-specific data cleansing processing system and customer-specific data cleansing processing method | |
TWI515677B (en) | Information processing system, information processing apparatus, information processing method, recording medium, and program | |
JP6108432B2 (en) | Anonymized data granularity management apparatus and granularity management method | |
JP6826360B2 (en) | Member information management system and member information management program | |
JP2015108934A (en) | Advertisement distribution system and advertisement distribution method | |
TWM560616U (en) | An electronic device for providing an associated menu | |
US20160224353A1 (en) | Method and apparatus for generating a plurality of graphical user interfaces | |
Patino | Better Reviews | |
CN117170624A (en) | Application program construction method, device, equipment, storage medium and program product |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160328 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160328 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170412 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170607 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20170620 |