JP4784854B2 - Data management apparatus and method - Google Patents
Data management apparatus and method Download PDFInfo
- Publication number
- JP4784854B2 JP4784854B2 JP2005172873A JP2005172873A JP4784854B2 JP 4784854 B2 JP4784854 B2 JP 4784854B2 JP 2005172873 A JP2005172873 A JP 2005172873A JP 2005172873 A JP2005172873 A JP 2005172873A JP 4784854 B2 JP4784854 B2 JP 4784854B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- file
- data
- information
- management
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、データ管理装置および方法に関し、特に、ネットワークを介して複数のノードに分散して記録されたデータを管理するデータ管理装置および方法に関する。 The present invention relates to a data management apparatus and method, and more particularly to a data management apparatus and method for managing data recorded in a distributed manner on a plurality of nodes via a network.
近年、コンピュータ技術の進歩に伴い、その性能は飛躍的に向上している。さらに、ネットワーク技術も発展し続けており、高速かつ大容量な通信が広範囲で可能となってきている。このような背景のもと、ネットワーク上の複数の資源を仮想化し統合して効率よく利用するための技術の一つとしてグリッド技術が注目されてきている。このグリッド技術は、広域ネットワーク上に分散して配置された資源の存在場所および所有者などをユーザに意識させずに、単にネットワークに接続するだけでそれらの資源を利用できるようにする。グリッド技術を使用すれば、ネットワークに接続された多くのストレージに分散して格納されているデータを統一的に利用できる。 In recent years, with the advancement of computer technology, its performance has improved dramatically. Furthermore, network technology continues to develop, and high-speed and large-capacity communication has become possible over a wide range. Against this background, grid technology has attracted attention as one of the technologies for virtualizing, integrating, and efficiently using a plurality of resources on a network. This grid technology makes it possible to use these resources simply by connecting to the network without making the user aware of the locations and owners of the resources distributed on the wide area network. If grid technology is used, data distributed and stored in many storages connected to the network can be used uniformly.
このようなグリッド技術を利用して、ネットワーク上の複数のノードの記録媒体へのアクセスを可能としたデータ管理装置として、たとえば特許文献1に記載されたものがある。同文献に記載されたデータ管理装置は、複数のデータファイルが格納されているストレージの違いをユーザに意識させずに、それらのデータファイルを統一的に使用可能にしている。
ところで、このようにネットワーク上のノードの記録媒体に格納されているデータファイルは、一つの場所にしか存在しないと、重要な情報が災害や故障などによって完全に消失してしまう危険性がある。さらに、一定のデータファイルへのアクセスが集中すると、処理速度や通信速度が低下してしまう。また、アクセス頻度が一定の記録媒体やデータファイルに集中すると、記録媒体の寿命が短命になってしまう危険性がある。 By the way, if the data file stored in the recording medium of the node on the network as described above exists only in one place, there is a risk that important information may be completely lost due to a disaster or a failure. Furthermore, when access to certain data files is concentrated, the processing speed and communication speed are reduced. Also, if the access frequency is concentrated on a recording medium or data file, there is a risk that the life of the recording medium will be shortened.
本発明は上記事情に鑑みてなされたものであり、その目的とするところは、リソースを効率よく分散させ、データファイルの安全性および信頼性の確保およびアクセス性能を向上させることができるデータ管理装置を提供することにある。 The present invention has been made in view of the above circumstances, and an object of the present invention is to provide a data management apparatus capable of efficiently distributing resources, ensuring safety and reliability of data files, and improving access performance. Is to provide.
本発明によれば、複数のノードがそれぞれ含む複数の記録媒体にそれぞれ記録された複数のデータファイルに、ネットワークを介してアクセスするアクセス部と、
前記複数のデータファイルにアクセスするためのパス情報を含んだ複数の管理用ファイルをそれぞれ生成する生成部と、
前記複数のデータファイルを前記管理用ファイルにより管理し、当該複数のデータファイルのそれぞれに対応した前記管理用ファイルを所定のディレクトリに配置させ、さらに前記ディレクトリを含んだ複数のディレクトリを階層構造によって論理的に管理する管理部と、
前記データファイルの複製ファイルを生成する複製部と、
所定のトリガ条件を満たしているか否かを判定する判定部と、
前記判定部が前記トリガ条件を満たしていると判定した時、前記データファイルの複製の生成を促すメッセージをユーザに報知する報知部と、
複製元の前記データファイルの属性情報を取得する属性情報取得部と、
前記属性情報に基づいて、所定の複製数決定条件に従って前記複製ファイルの複製数を決定する複製数決定部と、
前記複製数の前記複製ファイルを格納する格納先のノードを所定の条件に従って選択する格納先選択部と、
前記複製元の前記データファイルの前記属性情報を提示する情報提示部と、
前記報知部の前記報知を受けた前記ユーザが、前記情報提示部が提示した前記データファイルの前記属性情報を参照して決定した、複製指示を受け付ける指示受付部と、
前記格納先選択部が選択した前記格納先に前記複製ファイルを格納する格納部と、
を備え、
前記指示受付部が受け付けた前記複製指示に呼応して、
前記複製部が、前記複製ファイルを前記複製数決定部が決定した前記複製数分、生成し、
前記格納部が、前記格納先選択部が選択した前記格納先に、前記複製部が生成した前記複製数の前記複製ファイルを格納し、
前記生成部が、前記複製部が前記データファイルを前記複製数複製し、前記格納部が前記格納先に前記複製ファイルを格納した時、当該複製ファイルのパス情報を含む前記管理用ファイルを生成し、
前記アクセス部が、前記複数のディレクトリからなる前記階層構造の中の前記管理用ファイルに含まれた前記パス情報に基づいて、前記記録媒体に記録された前記データファイルにアクセスすることを特徴とするデータ管理装置が提供される。
According to the present invention, an access unit that accesses a plurality of data files respectively recorded on a plurality of recording media included in a plurality of nodes via a network;
A generating unit that generates a plurality of management files each including path information for accessing the plurality of data files;
The plurality of data files are managed by the management file, the management file corresponding to each of the plurality of data files is arranged in a predetermined directory, and the plurality of directories including the directory are logically structured by a hierarchical structure. The management department to manage automatically,
A duplicating unit for creating a duplicating file of the data file;
A determination unit for determining whether or not a predetermined trigger condition is satisfied;
When the determination unit determines that the trigger condition is satisfied, a notification unit that notifies a user of a message that prompts generation of a copy of the data file;
An attribute information acquisition unit for acquiring attribute information of the data file of the copy source ;
Based on the attribute information, a replication number determination unit that determines the replication number of the replication file according to a predetermined replication number determination condition;
A storage destination selection unit for selecting a storage destination node for storing the number of copies of the duplicate file according to a predetermined condition;
An information presentation unit for presenting the attribute information of the data file of the replication source;
An instruction receiving unit for receiving a duplication instruction determined by the user who has received the notification from the notification unit with reference to the attribute information of the data file presented by the information presentation unit;
A storage unit for storing the duplicate file in the storage destination selected by the storage destination selection unit;
With
In response to the copy instruction received by the instruction receiving unit,
The duplication unit generates the duplicate files for the number of duplications determined by the duplication number determination unit,
The storage unit stores, in the storage destination selected by the storage destination selection unit, the number of replica files generated by the replica unit, and
The generating unit, the copying unit is the copy number of copies of the data file, when the storage unit has stored the replica file to the storage location, generating the management file including path information of the duplicate files ,
Said access unit is based on the path information included in the management file in the hierarchical structure comprising a plurality of directories, characterized in that access to the data file recorded on the recording medium A data management device is provided.
ここで、データファイルとは、クライアントからの演算要求に応じて複数のリソースが演算処理に使用する情報や、その演算処理結果を含む。また、記録媒体とは、フロッピー(登録商標)ディスク、CD、DVD、MO、磁気テープ、USBメモリ、各種メモリカードなどの各種メディアと、ハードディスク装置などの記憶装置とを含む。 Here, the data file includes information used by a plurality of resources for calculation processing in response to a calculation request from the client and the calculation processing result. The recording medium includes various media such as a floppy (registered trademark) disk, CD, DVD, MO, magnetic tape, USB memory, and various memory cards, and a storage device such as a hard disk device.
パス情報は、IP(Internet Protocol)アドレスなどのネットワークアドレス、記録媒体内のアドレス、およびデータファイルをアクセスするためのアクセス手段、たとえば、http(HyperText Transfer Protocol)やftp(File Transfer Protocol)などのプロトコルによって指定可能であるが、これらに限らずデータファイルの位置が特定できればよいものとする。たとえば、URL(Uniform Resource Locators)やEPR(WS-Addressing EndPoint Reference)などで表すことができる。 The path information includes a network address such as an IP (Internet Protocol) address, an address in a recording medium, and an access means for accessing a data file, for example, a protocol such as http (HyperText Transfer Protocol) or ftp (File Transfer Protocol). However, the present invention is not limited to this, and it is sufficient that the position of the data file can be specified. For example, it can be expressed by URL (Uniform Resource Locators) or EPR (WS-Addressing EndPoint Reference).
階層構造は、別のファイルによって、階層構造が管理されていてもよいが、それに限らず、管理用ファイルやディレクトリの一部にその上位と下位のディレクトリ等の情報が付加されて、論理的にのみ形成されていてもよい。 The hierarchical structure may be managed by another file. However, the present invention is not limited to this, and information such as the upper and lower directories is added to a part of the management file or directory to logically. It may be formed only.
ここで、データファイルの属性情報とは、たとえば、ファイルサイズ、生成時刻、更新時刻、オーナーなどの属性である。さらに、格納情報の種類を含むこともできる。すなわち、失われては困る情報を含むかどうかを示すファイルの重要度、個人情報、著作権、機密情報など必要な安全性の指標、人気度などにより格納情報の種類を分類し、ランク付けすることができる。なお、属性情報は、複製する都度取得して使用してもよいし、定期的または随時取得して記憶しておいた情報を使用してもよい。
この発明によれば、ネットワーク上の複数のノードの記録媒体にデータファイルの複製を所定の条件に従って分散させて格納することができるので、効率よく、資源の安全性および信頼性の確保およびアクセス性能の向上を図ることができる。
Here, the attribute information of the data file is, for example, attributes such as a file size, a generation time, an update time, and an owner. Furthermore, the type of stored information can also be included. In other words, the type of stored information is classified and ranked according to the importance of the file that indicates whether it contains information that would not be lost, personal information, copyright, confidential information, necessary safety indicators, popularity, etc. be able to. The attribute information may be acquired and used every time it is copied, or information acquired and stored periodically or as needed may be used.
According to the present invention, since a copy of a data file can be distributed and stored in a recording medium of a plurality of nodes on a network according to a predetermined condition, it is possible to efficiently secure resource safety and reliability and access performance. Can be improved.
また、この構成によれば、データファイルの属性やファイル格納情報の種類によって複製数を決定することができるので、効率よく、資源の安全性および信頼性の確保およびアクセス性能の向上を図ることが可能となる。
また、ストレージおよびネットワークの利用状況、たとえば、性能に対する負荷、累積、短期間、ファイル単位、ディスク単位、組織または地域単位などのアクセス頻度、ストレージ容量の空きの増減の変化量などを条件とすることもできる。
この構成によれば、所定の条件を満たした時のタイミングでデータファイルを複製することが可能となり、データファイルの破損や消滅の危険性の回避などが可能となり、信頼性が向上する。
また、この構成によれば、データファイルの複製タイミングを知らせることができるので、適切なタイミングで効率よく資源の安全性および信頼性の確保およびアクセス性能の向上を図ることが可能となる。
Further, according to this configuration, since the number of copies can be determined according to the attribute of the data file and the type of file storage information, it is possible to efficiently ensure the safety and reliability of resources and improve the access performance. It becomes possible.
In addition, the usage conditions of storage and network, for example, load on performance, accumulation, short term, access frequency of file unit, disk unit, organization or region unit, change amount of increase / decrease in storage capacity, etc. You can also.
According to this configuration, the data file can be duplicated at a timing when a predetermined condition is satisfied, the risk of damage or disappearance of the data file can be avoided, and reliability is improved.
Further, according to this configuration, it is possible to notify the duplication timing of the data file, so that it is possible to efficiently ensure the safety and reliability of resources and improve the access performance at an appropriate timing.
上記データ管理装置において、前記格納先選択部は、前記複数のノードの前記記録媒体の性能を示す性能情報を前記ネットワークを介して問い合わせて取得する性能情報取得部と、前記性能情報に基づいて、所定の格納条件を満たしている前記格納先のノードを選択する選択部と、を含むことができる。 In the data management apparatus, the storage destination selection unit, based on the performance information, a performance information acquisition unit that inquires and acquires performance information indicating the performance of the recording medium of the plurality of nodes via the network, And a selection unit that selects the storage destination node that satisfies a predetermined storage condition.
ここで、性能情報とは、たとえば、ノードの記録媒体の空き容量、アクセス性能、アクセスCPUの性能、利用者とのネットワーク的な設置場所などである。これらの性能情報は、たとえば、記録媒体の空き容量であれば、記録媒体を使用してデータ処理を行うデータ処理装置にネットワークを介して問い合わせることにより取得することができる。また、アクセス性能は、実際にノードの記録媒体にネットワークを介してアクセスし、その応答時間を計測し、取得することができる。また、利用者とのネットワーク的な設置場所は、利用者の装置からネットワークを介して問い合わせ信号を送信し、その応答時間を計測することにより取得することができる。選択部は、これらの性能情報が所定の条件を満たしているノードの記録媒体を格納先として選択する。 Here, the performance information is, for example, the free capacity of the recording medium of the node, the access performance, the performance of the access CPU, the network installation location with the user, and the like. Such performance information can be acquired, for example, by making an inquiry over a network to a data processing device that performs data processing using the recording medium if the recording medium has free space. The access performance can be acquired by actually accessing the recording medium of the node via the network, measuring the response time. Also, the network location with the user can be acquired by transmitting an inquiry signal from the user's device via the network and measuring the response time. The selection unit selects a recording medium of a node whose performance information satisfies a predetermined condition as a storage destination.
性能情報に対する条件は、複数の条件を組み合わせたり、優先順位を設けたりすることもできる。さらに、上述のデータファイルの属性を条件として、格納先を決定することができる。なお、性能情報は、複製する都度取得して使用してもよいし、定期的または随時取得して記憶しておいた情報を使用してもよい。 The condition for the performance information can be a combination of a plurality of conditions or a priority order. Furthermore, the storage destination can be determined on the condition of the attribute of the data file described above. The performance information may be acquired and used every time it is copied, or information acquired and stored periodically or as needed may be used.
この構成によれば、所定の格納条件に従って格納先を選択することができるので、データファイルの複製を所定の条件に従って分散させて適切な格納先に格納することができるので、効率よく、資源の安全性および信頼性の確保およびアクセス性能の向上を図ることができる。 According to this configuration, the storage destination can be selected according to the predetermined storage condition, so that the copy of the data file can be distributed according to the predetermined condition and stored in an appropriate storage destination. It is possible to ensure safety and reliability and improve access performance.
上記データ管理装置において、前記複数のノードの前記記録媒体の特性に関する特性情報を登録する登録部をさらに含み、前記格納先選択部は、前記特性情報を前記登録部に問い合わせて取得する特性情報取得部と、前記特性情報に基づいて、所定の格納条件を満たしている前記格納先のノードを選択する選択部と、を含むことができる。 The data management apparatus further includes a registration unit that registers characteristic information regarding the characteristics of the recording medium of the plurality of nodes, and the storage destination selection unit acquires the characteristic information by inquiring and acquiring the characteristic information from the registration unit And a selection unit that selects the storage destination node that satisfies a predetermined storage condition based on the characteristic information.
特性情報とは、ノードの記録媒体の信頼性、そのファイルシステムのMTBF(Mean Time Between Failures:平均故障間隔)、MTTR(Mean Time To Repair:平均復旧時間)、UPS(Uninterruptable Power Supply:無停電電源装置)の有無などである。さらに、地理的、ネットワーク的な設置距離間隔、設置場所の安全性、たとえば、設置状況、構造、災害頻度、物理的な安全性、たとえば、警備状況、ストレージの容量当たりのコストパフォーマンスなどを含むことができる。 The characteristic information includes the reliability of the recording medium of the node, MTBF (Mean Time Between Failures) of the file system, MTTR (Mean Time To Repair), UPS (Uninterruptable Power Supply) The presence or absence of a device). In addition, geographical and network installation distance intervals, installation site safety, such as installation status, structure, disaster frequency, physical safety, eg security status, cost performance per storage capacity, etc. Can do.
たとえば、地理的な設置距離間隔が所定距離以上のノードや、安全性の高い設置場所のもの、構造上の強度が高いもの、コストが安い、利用者とのネットワーク的な設置場所が便利などを条件とすることができる。 For example, a node with a geographical distance of more than a predetermined distance, a highly secure installation location, a high structural strength, a low cost, a convenient network installation location with users, etc. It can be a condition.
特性情報に対する条件は、複数の条件を組み合わせたり、優先順位を設けたりすることもできる。さらに、上述のデータファイルの属性を条件として、格納先を決定することができる。なお、特性情報は、複製する都度取得して使用してもよいし、定期的または随時取得して記憶しておいた情報を使用してもよい。 The condition for the characteristic information can be a combination of a plurality of conditions or a priority order. Furthermore, the storage destination can be determined on the condition of the attribute of the data file described above. The characteristic information may be acquired and used every time it is copied, or information acquired and stored periodically or as needed may be used.
この構成によれば、所定の格納条件に従って格納先を選択することができるので、データファイルの複製を所定の条件に従って分散させて適切な格納先に格納することができ、効率よく、資源の安全性および信頼性の確保およびアクセス性能の向上を図ることができる。 According to this configuration, the storage destination can be selected according to the predetermined storage condition, so that the copy of the data file can be distributed according to the predetermined condition and stored in an appropriate storage destination. Secure and reliable and improve access performance.
上記データ管理装置において、前記トリガ条件は、前記格納部による前記データファイルの格納時、更新時、定期的、保守作業発生時、災害、警報、ネットワークまたはストレージの故障のイベント発生時を複製のトリガとした前記複製ファイルを生成するタイミングを含むことができる。
また、ストレージおよびネットワークの利用状況、たとえば、性能に対する負荷、累積、短期間、ファイル単位、ディスク単位、組織または地域単位などのアクセス頻度、ストレージ容量の空きの増減の変化量などを条件とすることもできる。
In the data management apparatus, the trigger condition is a trigger for replication when the data file is stored, updated, periodically, maintenance work occurs, disaster, alarm, network or storage failure event occurs by the storage unit. The generation timing of the duplicate file can be included.
Also, storage and network usage, for example, load on the performance, cumulative, short term, a file unit, a disk unit, the access frequency of such organization or local unit, the conditions such as the amount of change in free increase and decrease of the storage capacity You can also.
上記データ管理装置において、前記指示受付部は、前記複製指示として、前記報知部の前記報知を受けた前記ユーザが、前記情報提示部が提示した前記データファイルの前記属性情報を参照して決定した、複製元のデータファイルの格納先、および当該複製元のデータファイルの複製数を受け付け、前記複製部は、前記指示受付部が受け付けた前記複製指示に呼応して、前記指示受付部が受け付けた前記格納先の前記複製元のデータファイルの複製ファイルを、前記指示受付部が受け付けた前記複製数分、生成することができる。 In the data management apparatus, the instruction receiving unit is determined by the user who has received the notification from the notification unit as the duplication instruction with reference to the attribute information of the data file presented by the information presentation unit. The copy source data file storage destination and the copy number of the copy source data file are received , and the copy unit is accepted by the instruction receiving unit in response to the copy instruction received by the instruction receiving unit. Duplicate files of the copy source data file at the storage destination can be generated for the number of copies accepted by the instruction accepting unit.
この構成によれば、提示されたデータファイルの属性情報に基づいて、複製数を使用者が手動で指定することができる複製ファイルのデータ管理を支援可能なデータ管理装置が提供される。 According to this configuration, there is provided a data management device capable of supporting data management of a replicated file that allows the user to manually specify the number of replicas based on the attribute information of the presented data file.
上記データ管理装置において、前記情報提示部は、前記性能情報取得部が取得した前記性能情報または前記特性情報取得部が取得した前記特性情報をさらに提示し、前記指示受付部は、前記複製指示として、前記ユーザが、前記情報提示部が提示した前記性能情報または前記特性情報を参照して決定した、前記複製ファイルの前記格納先を受け付け、前記格納部は、前記指示受付部が受け付けた前記複製指示に呼応して、前記指示受付部が受け付けた前記格納先に前記複製ファイルを格納することができる。 In the data management apparatus, the information presentation unit, the performance the performance information or the characteristic information obtaining unit information acquisition unit has acquired to the characteristic information further presents acquisition, the instruction accepting unit, as the copy instructing the user, the information presentation portion is determined with reference to the performance information or the characteristic information presented, Installing receives the storage destination of the copy file, the storage unit, the instruction accepting unit accepts In response to the replication instruction, the replication file can be stored in the storage location received by the instruction reception unit.
この構成によれば、提示された性能情報に基づいて、複製ファイルの格納先を使用者が手動で指定することができる複製ファイルのデータ管理を支援可能なデータ管理装置が提供される。 According to this configuration, there is provided a data management apparatus capable of supporting data management of a replicated file that allows a user to manually specify a storage location of the replicated file based on the presented performance information.
本発明によれば、複数のノードがそれぞれ含む複数の記録媒体にそれぞれ記録された複数のデータファイルに、ネットワークを介してアクセスするアクセス部と、
前記複数のデータファイルにアクセスするためのパス情報を含んだ複数の管理用ファイルをそれぞれ生成する生成部と、
前記複数のデータファイルを前記管理用ファイルにより管理し、当該複数のデータファイルのそれぞれに対応した前記管理用ファイルを所定のディレクトリに配置させ、さらに前記ディレクトリを含んだ複数のディレクトリを階層構造によって論理的に管理する管理部とを備え、
前記アクセス部が、前記複数のディレクトリからなる前記階層構造の中の前記管理用ファイルに含まれた前記パス情報に基づいて、前記記録媒体に記録された前記データファイルにアクセスする前記データ管理装置におけるデータ管理方法であって、
前記データ管理装置が、
所定のトリガ条件を満たしているか否かを判定するステップと、
前記判定するステップで前記トリガ条件を満たしていると判定した時、前記データファイルの複製の生成を促すメッセージをユーザに報知するステップと、
複製元の前記データファイルの属性情報を取得するステップと、
前記属性情報に基づいて、所定の複製数決定条件に従って複製ファイルの複製数を決定するステップと、
前記複製数の前記複製ファイルを格納する格納先のノードを所定の条件に従って選択するステップと、
前記複製元の前記データファイルの前記属性情報を提示するステップと、
前記報知するステップの前記報知を受けて前記ユーザが、前記属性情報を提示するステップで提示された前記データファイルの前記属性情報を参照して決定した、複製指示を受け付けるステップと、
前記複製指示を受け付けるステップで受け付けた前記複製指示に呼応して、前記複製ファイルを前記複製数を決定するステップで決定した前記複製数分、生成するステップと、
前記格納先を選択するステップで選択した前記格納先に、生成された前記複製数の前記複製ファイルを格納するステップと、
前記複製ファイルを生成するステップで前記データファイルが前記複製数複製され、前記格納するステップで前記格納先に前記複製ファイルを格納された時、当該複製ファイルのパス情報を含む前記管理用ファイルを生成するステップと、を順に行うことを特徴とするデータ管理方法が提供される。
According to the present invention, an access unit that accesses a plurality of data files respectively recorded on a plurality of recording media included in a plurality of nodes via a network ;
A generating unit that generates a plurality of management files each including path information for accessing the plurality of data files;
The plurality of data files are managed by the management file, the management file corresponding to each of the plurality of data files is arranged in a predetermined directory, and the plurality of directories including the directory are logically structured by a hierarchical structure. With a management unit that manages
In the data management device, the access unit accesses the data file recorded on the recording medium based on the path information included in the management file in the hierarchical structure including the plurality of directories. A data management method,
Before Symbol data management device,
Determining whether a predetermined trigger condition is satisfied;
When determining that the trigger condition is satisfied in the determining step, notifying the user of a message prompting generation of a copy of the data file;
Obtaining attribute information of the data file of the replication source;
Based on the attribute information and determining the number of copies of the duplication files in accordance with predetermined copy number determination condition,
Selecting a storage destination node for storing the number of copies of the duplicate file according to a predetermined condition;
Presenting the attribute information of the data file of the replication source;
Receiving the notification in the notifying step, receiving a replication instruction determined by the user with reference to the attribute information of the data file presented in the step of presenting the attribute information;
In response to the copy instruction received in the step of receiving the copy instruction, generating the copy file for the number of copies determined in the step of determining the number of copies;
The storage destination selected in the step of selecting the storage location, and storing the generated the copy number of the previous SL duplicate files,
When the number of copies of the data file is duplicated in the step of creating the duplicate file and the duplicate file is stored in the storage destination in the storing step, the management file including path information of the duplicate file is created. data management method according to claim rows Ukoto steps, in this order to are provided.
本発明によれば、複数のノードがそれぞれ含む複数の記録媒体にそれぞれ記録された複数のデータファイルに、ネットワークを介してアクセスするデータ管理用コンピュータを、
前記複数のデータファイルに、前記ネットワークを介してアクセスする手段と、
前記複数のデータファイルにアクセスするためのパス情報を含んだ複数の管理用ファイルをそれぞれ生成する手段と、
前記複数のデータファイルを前記管理用ファイルにより管理し、当該複数のデータファイルのそれぞれに対応した前記管理用ファイルを所定のディレクトリに配置させ、さらに前記ディレクトリを含んだ複数のディレクトリを階層構造によって論理的に管理する手段と、
前記データファイルの複製ファイルを生成する手段と、
所定のトリガ条件を満たしているか否かを判定する手段と、
前記判定する手段が前記トリガ条件を満たしていると判定した時、前記データファイルの複製の生成を促すメッセージをユーザに報知する手段と、
複製元の前記データファイルの属性情報を取得する手段と、
前記属性情報に基づいて、所定の複製数決定条件に従って前記複製ファイルの複製数を決定する手段と、
前記複製数の前記複製ファイルを格納する格納先のノードを所定の条件に従って選択する手段と、
前記複製元の前記データファイルの前記属性情報を提示する手段と、
前記報知する手段の前記報知を受けて前記ユーザが、前記提示する手段が提示した前記データファイルの前記属性情報を参照して決定した、複製指示を受け付ける手段と、
前記複製指示を受け付ける手段が受け付けた前記複製指示に呼応して、前記複製ファイルを生成する手段に、前記複製数を決定する手段が決定した前記複製数分、前記複製ファイルを生成させる手段と、
前記格納先を選択する手段が選択した前記格納先に、生成された前記複製数の前記複製ファイルを格納する手段と、
前記複製ファイルを生成する手段が前記データファイルを前記複製数複製し、前記格納する手段が前記格納先に前記複製ファイルを格納した時、当該複製ファイルのパス情報を含む前記管理用ファイルを生成する手段と、
前記複数のディレクトリからなる前記階層構造の中の前記管理用ファイルに含まれた前記パス情報に基づいて、前記記録媒体に記録された前記データファイルにアクセスする手段、
として機能させることを特徴とするプログラムが提供される。
According to the present invention, the plurality of nodes to a plurality of recording media each including recorded plurality of data files, the data management computer that accesses through the network,
Means for accessing the plurality of data files via the network;
Means for generating a plurality of management files each including path information for accessing the plurality of data files;
The plurality of data files are managed by the management file, the management file corresponding to each of the plurality of data files is arranged in a predetermined directory, and the plurality of directories including the directory are logically structured by a hierarchical structure. Means to manage automatically,
Means for generating a duplicate file of the data file;
Means for determining whether or not a predetermined trigger condition is satisfied;
Means for notifying a user of a message prompting generation of a duplicate of the data file when the determining means determines that the trigger condition is satisfied;
Means for obtaining attribute information of the data file of the copy source ;
Means for determining the number of replicas of the replica file according to a predetermined replica number determination condition based on the attribute information;
Means for selecting, according to a predetermined condition, a storage destination node for storing the number of replica files;
Means for presenting the attribute information of the data file of the replication source;
Means for receiving a duplication instruction determined by the user with reference to the attribute information of the data file presented by the presenting means upon receiving the notice from the notifying means;
In response to the copy instruction received by the means for receiving the copy instruction, the means for generating the copy file generates the copy file for the number of copies determined by the means for determining the copy number;
Means for storing, in the storage destination selected by the means for selecting the storage destination, the duplicate files of the generated number of replicas;
When the means for generating the duplicate file duplicates the number of copies of the data file, and the means for storing stores the duplicate file at the storage destination, the management file including path information of the duplicate file is created. Means,
Means for accessing the data file recorded on the recording medium based on the path information included in the management file in the hierarchical structure comprising the plurality of directories;
Program characterized Rukoto to function as is provided.
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。 It should be noted that any combination of the above-described constituent elements and a conversion of the expression of the present invention between a method, an apparatus, a system, a recording medium, a computer program, etc. are also effective as an aspect of the present invention.
本発明によれば、リソースを効率よく分散させ、データファイルの安全性および信頼性の確保およびアクセス性能を向上させることができるデータ管理装置が提供される。 According to the present invention, there is provided a data management apparatus capable of efficiently distributing resources, ensuring the safety and reliability of data files, and improving access performance.
以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. In all the drawings, the same reference numerals are given to the same components, and the description will be omitted as appropriate.
図1は、本発明の実施の形態に係るデータ処理システムの構成を示す図である。本実施形態は、グリッド技術を利用し、記録媒体とCPUを含んだ処理装置(ノード)がネットワークを介して複数接続され、それらが互いに連動しながら並列計算処理を実行する並列計算システムに関し、特にその中でも複数の処理装置の記録媒体にそれぞれ記録された複数のデータファイルを管理するデータ管理システムに関する。 FIG. 1 is a diagram showing a configuration of a data processing system according to an embodiment of the present invention. The present embodiment relates to a parallel computing system that uses grid technology, a plurality of processing devices (nodes) including a recording medium and a CPU are connected via a network, and performs parallel computing processing in conjunction with each other. In particular, the present invention relates to a data management system for managing a plurality of data files respectively recorded on recording media of a plurality of processing apparatuses.
ここで、データファイルとは、クライアントからの演算要求に応じて複数のリソースが演算処理に使用する情報や、その演算処理結果を含む。あるいは、ビジネス分野などで利用されるディジタルデータを含む。また、本実施形態において、記録媒体はハードディスク装置などの記憶装置である。 Here, the data file includes information used by a plurality of resources for calculation processing in response to a calculation request from the client and the calculation processing result. Alternatively, digital data used in the business field or the like is included. In the present embodiment, the recording medium is a storage device such as a hard disk device.
また、本実施形態において、処理装置が処理する演算処理とは、たとえば、メールなどを含むディジタルデータのアーカイブ、バックアップ処理、あるいは、科学技術やエンジニアリング、例として、自動車設計分野におけるCAE(Computer Aided Engineering)や衝突解析、製薬企業におけるドラッグスクリーニング解析、航空機設計分野における流体解析や構造解析、金融業におけるクレジットリスク分析、材料開発分野における分子・原子のシミュレーション、素粒子物理学分野、天文学分野のデータ解析、生命情報学分野におけるたんぱく質の機能予測、地球惑星科学分野における衛星、地上観測データによる標高データ作成などに関する設計・計算・解析などの処理が挙げられる。その他、ビジネス分野などにおいて格納されたディジタルデータの処理を含むことができる。 Further, in the present embodiment, the arithmetic processing processed by the processing device is, for example, digital data archiving including email, backup processing, or science and engineering, for example, CAE (Computer Aided Engineering in the automotive design field) ) And collision analysis, drug screening analysis in pharmaceutical companies, fluid analysis and structural analysis in aircraft design field, credit risk analysis in financial industry, molecular / atom simulation in material development field, particle physics field, astronomy field data analysis These include design, calculation, and analysis related to protein function prediction in the field of bioinformatics, satellites in the earth and planetary science field, and elevation data creation from ground observation data. In addition, processing of digital data stored in a business field or the like can be included.
図1に示すように、データ処理システム100は、クライアント装置10、サーバ装置12、記録部14、処理装置16と総称される第1処理装置16a、第2処理装置16b、第3処理装置16c、第4処理装置16d、第5処理装置16e、第6処理装置16f、ネットワーク18を含む。また、サーバ装置12は、アクセス部20、受付部22、管理部24、生成部26、決定部28、指示部30を含み、処理装置16は、処理部40と総称される第1処理部40a、第2処理部40b、第3処理部40c、第4処理部40d、第5処理部40e、第6処理部40f、記録部42と総称される第1記録部42a、第2記録部42b、第3記録部42c、第4記録部42d、第5記録部42e、第6記録部42fをそれぞれ含む。なお、本実施形態において、各処理装置16は、一つの記録部42を含む構成としているが、これに限定されない。各処理装置16が複数の記録部42を含むこともできる。
As shown in FIG. 1, the
複数の処理装置16がネットワーク18を介して接続され、クライアント装置10からの演算要求に応じて、サーバ装置12によって処理装置16を連動させて要求された演算処理を実行し、得られた演算結果をクライアント装置10に返すものである。
A plurality of processing devices 16 are connected via the network 18, and in response to a calculation request from the client device 10, the
ネットワーク18は、所定のプロトコルによって、情報信号を通信する。ネットワーク18は、主に同軸ケーブル、ツイストペアケーブル、光ケーブル等の信号を伝達するためのケーブルを、ルータ、交換機等の信号の伝達経路を制御する装置で接続して構成されている。図1では、ひとつのネットワーク18のみを示しているが、これに限らず、複数のネットワークの結合によって構成されていてもよく、複数のネットワークのバンド幅がそれぞれ異なっていてもよい。 The network 18 communicates information signals according to a predetermined protocol. The network 18 is configured by connecting cables for transmitting signals, such as coaxial cables, twisted pair cables, and optical cables, with devices that control signal transmission paths such as routers and exchanges. Although only one network 18 is shown in FIG. 1, the present invention is not limited to this, and the network 18 may be configured by combining a plurality of networks, and the bandwidths of the plurality of networks may be different from each other.
クライアント装置10は、ユーザが操作するパーソナルコンピュータ等である。クライアント装置10は、ネットワーク18を介して後述のサーバ装置12に対して、データファイルの検索や計算処理等の指示を出力し、サーバ装置12からその結果を受け付け、図示しないディスプレイに表示する。
The client device 10 is a personal computer or the like operated by a user. The client device 10 outputs an instruction such as data file search or calculation processing to the
本実施形態において、処理装置16の記録部42は、データファイルを記録するハードディスク等の記憶装置である。ここでデータファイル「DATA A」は、第1記録部42aと第6記録部42fに複製され記録されている。また、データファイル「DATA B」は、データ容量が大きいため、データファイル「DATA B−1」、「DATA B−2」、「DATA B−3」に分割されており、データファイル「DATA B−1」は、第1記録部42aと第4記録部42dに複製されて記録され、データファイル「DATA B−2」は、第2記録部42bと第5記録部42eに複製されて記録され、データファイル「DATA B−3」は、第3記録部42cと第6記録部42fに複製され記録されている。また、予め記録していたデータファイルだけではなく、後述の処理部40の処理によって生成されたデータファイルも記録する。
In the present embodiment, the
処理装置16の処理部40は、計算やデータファイル検索等の処理を実行するCPU、データファイルを一時的に記録するRAM(Random Access Memory)等を含む。ここで、計算やデータファイル検索等の対象となるデータファイルや処理は後述のサーバ装置12から指示される。
The processing unit 40 of the processing device 16 includes a CPU that executes processing such as calculation and data file search, a RAM (Random Access Memory) that temporarily records data files, and the like. Here, a data file and processing to be subjected to calculation, data file search, and the like are instructed from the
サーバ装置12において、アクセス部20は、ネットワーク18と接続し、データや所定の指示のための信号を入出力する。受付部22は、ネットワーク18とアクセス部20を介してクライアント装置10や処理装置16から出力されたデータ等を受け付ける。クライアント装置10からはデータファイルの検索、計算処理、管理しているデータファイルの表示等の指示を受け付ける。処理装置16からはそれぞれの記録部42で記録しているデータファイルのパス情報を受け付けたり、予めサーバ装置12から出力した指示に応じた結果を受け付けたりする。なお、パス情報の具体例については、後述する。
In the
生成部26は、受付部22で受け付けたデータファイルのパス情報にもとづいて、記録部42で記録されているデータファイルのパス情報を含んだ管理用ファイルを生成する。生成する際、例えば、管理用ファイルの名称は、それに対応するデータファイルに一致するように決定する。ここで、データファイル「DATA A」のように複数の記録部42に記録されている場合は、複数のパス情報を管理用ファイルに記載する。また、データファイルの生成段階あるいは生成前に、あらかじめデータファイルに対応付けられた管理用ファイルを生成してもよい。なお、生成段階とは、データファイルを生成している場合だけではなく、データファイルの生成前も含み、データファイルが完成されていない段階を示す。
The generating
管理部24は、管理用ファイルを所定のディレクトリに配置させ、複数のディレクトリを階層構造によって管理する。なお、管理すべき階層構造を形成する複数のディレクトリの情報および管理用ファイルは記録部14に記録される。また、クライアント装置10からの指示によって所定のデータファイルを検索する場合、管理部24は、記録部14にアクセスし、階層構造を形成する複数のディレクトリの情報から、検索対象のデータファイルに対応した管理用ファイルを検索する。
The
また、管理部24は、後述するようにデータファイルが複製されたとき、生成部26に、その複製ファイルの管理用ファイルの生成を指示し、その管理用ファイルを所定のディレクトリに配置させ、複数のディレクトリを階層構造によって管理する。この管理すべき階層構造を形成する複数のディレクトリの情報および管理用ファイルは記録部14に記録される。
Further, when the data file is duplicated as will be described later, the
決定部28は、クライアント装置10からの指示に応じた処理を複数の処理部40が実行する場合に、処理を実際に実行すべき処理部40を決定する。ここでは、既に実行されている処理を無視すれば、処理対象のデータファイルを記録している記録部42と同一の処理装置16に含まれている処理部40に処理を優先的に割り当てる。例えば、クライアント装置10からの指示がデータファイル「DATA A」の検索処理の場合、決定部28は、データファイル「DATA A」を記録した第1記録部42aと同一の第1処理装置16aに含まれた第1処理部40aに当該処理を割り当てる。なお、データファイル「DATA A」は、第6記録部42fにも記録されているため、当該処理を第6処理部40fに割り当ててもよい。
The determination unit 28 determines the processing unit 40 that should actually execute the process when the plurality of processing units 40 execute the process according to the instruction from the client device 10. Here, if processing that has already been executed is ignored, processing is preferentially assigned to the processing unit 40 included in the same processing device 16 as the
指示部30は、決定部28によって決定された処理装置16に処理の実行を指示したり、あるいは管理部24で直接実行された処理結果を出力する。
The
データ処理システム100の構成は、ハードウェア的には、任意のコンピュータのCPU、メモリ、その他のLSIで実現でき、ソフトウェア的にはメモリのロードされた予約管理機能のあるプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者には理解されるところである。以下説明する各図は、ハードウェア単位の構成ではなく、機能単位のブロックを示している。また、各図において、本発明の本質に関わらない部分の構成については省略してある。
The configuration of the
以上のように構成された本実施形態のデータ処理システム100は、複数の処理装置16が接続されたネットワーク18にさらにサーバ装置12を接続し、当該サーバ装置12は、複数の処理装置16に記録された複数のデータファイルのそれぞれに対して、パス情報を含んだ管理用ファイルを生成する。例えば、データファイル「A」に対応した管理用ファイル「A」は、データファイル「A」を記録した処理装置16のネットワークアドレスと処理装置16に含まれた記録部42内の記録領域のアドレスを記載している。さらに、サーバ装置12は、複数のデータファイルを直接管理せず、その代わりに複数の管理用ファイルを所定のディレクトリに配置させ、そのような複数のディレクトリを階層構造によって管理する。ユーザまたはプログラムが所定のデータファイルを指定する場合、階層構造を形成するディレクトリの中から当該データファイルに対応した管理用ファイルを指定する。サーバ装置12は、指定された管理用ファイルに含まれたパス情報にもとづいて、当該データファイルが記録された処理装置16にアクセスし、当該データファイルを指定する。
In the
図2は、サーバ装置12でのファイルシステムの構成を示す。図2の上部に記録部14で記録されている複数のディレクトリが形成する階層構造の情報を示す。ディレクトリ「/grid」が階層構造の最上位に位置づけられており、その下位にディレクトリ「ggf」と「jp」が配置されている。ディレクトリ「jp」の下位には、管理用ファイル50a(図中、「DATA A」と示す)が配置されている。さらに、ディレクトリ「ggf」の下位のディレクトリ「aist」の下位には、管理用ファイル50b、50c、50d(図中、「DATA B−1」、「DATA B−2」、「DATA B−3」とそれぞれ示す)が配置されている。ここで、管理用ファイル50b、50c、50dは、図1のデータファイル「DATA A」、「DATA B−1」、「DATA B−2」、「DATA B−3」にそれぞれ対応した管理用ファイルである。
FIG. 2 shows the configuration of the file system in the
管理用ファイル50aは、パス情報として「ftp://p1.co.jp/a/DATAA」と「http://p6.co.jp/a/DATAA」を記載している。ここで、図1の第1処理装置16aが「p1.co.jp」に、第6処理装置16fが「p6.co.jp」に対応し、データファイル「DATA A」が「DATAA」に対応する。また、管理用ファイル50b、50c、50dについても同様である。 The management file 50a describes “ftp://p1.co.jp/a/DATAA” and “http://p6.co.jp/a/DATAA” as path information. Here, the first processing device 16a in FIG. 1 corresponds to “p1.co.jp”, the sixth processing device 16f corresponds to “p6.co.jp”, and the data file “DATA A” corresponds to “DATAA”. To do. The same applies to the management files 50b, 50c, and 50d.
図2の下部には、図1での説明と同様に、記録部42で記録されているデータファイルを示す。記録部42のそれぞれの上部には、前述のごとく、それぞれのプロトコルとネットワークアドレスを「ftp://p1.co.jp」のように示す。また、記録部42のそれぞれの内部には、記録領域のアドレスを「/a/DATAA」と「/b/DATAB−1」のように示す。データファイルは、複数の記録部42に分散して記録されているが、記録部14では、それらのデータファイルを直接管理するのではなく、データファイルに対応した管理用ファイルを階層構造によって管理するため、図示のごとく、データファイルを記録した記録部42を意識することなく、データファイルを管理可能である。
The lower part of FIG. 2 shows the data file recorded by the
ユーザまたはプログラムがデータファイル「DATA B−1」に対する処理を指示した場合、管理部24は、記録部14に記録された管理用ファイル50bのパス情報に応じて、第1記録部42aか第4記録部42dの「/b/DATAB−1」にアクセスする。一方、データファイル「DATA B」のすべてに対する処理を指示する場合、管理部24は、データファイル「DATA B」に対応した管理用ファイル50b、50c、50dをすべて含んだディレクトリ「aist」をデータファイル「DATA B」に対応した管理用ファイル50eとみなす。さらに、それらに記載されたパス情報にもとづいて、対応すべき記録部42にアクセスする。
When the user or the program instructs the processing for the data file “DATA B-1”, the
図3は、本発明の実施形態に係るデータ処理システム100の要部構成であるバックアップ部60の機能ブロック図である。図1のデータ処理システム100は、さらに図3のバックアップ部60を含むことができる。本実施形態において、バックアップ部60は、サーバ装置12に含まれるが、これに限定されない。
FIG. 3 is a functional block diagram of the
本発明の実施の形態に係るデータ処理システム100は、複数のノードがそれぞれ含む複数の記録媒体(図1の記録部42)にそれぞれ記録された複数のデータファイルに、ネットワーク(図1のネットワーク18)を介してアクセスするアクセス部(図1のアクセス部20)と、複数のデータファイルにアクセスするためのパス情報を含んだ複数の管理用ファイルをそれぞれ生成する生成部(図1の生成部26)と、複数のデータファイルを管理するために、複数のデータファイルのそれぞれに対応した管理用ファイルを所定のディレクトリに配置させ、さらにディレクトリを含んだ複数のディレクトリを階層構造によって論理的に管理する管理部(図1の管理部24)と、データファイルの複製ファイルを生成する複製部(図3の複製部106)と、複製ファイルを格納する格納先のノードを所定の条件に従って選択する格納先選択部(図3の格納先選択部128)と、格納先選択部が選択した格納先に複製ファイルを格納する格納部(図3の格納部120)と、を備え、生成部は、複製部がデータファイルを複製し、格納部が格納先に複製ファイルを格納した時、当該複製ファイルのパス情報を含む管理用ファイルを生成し、アクセス部は、複数のディレクトリからなる階層構造の中の管理用ファイルに含まれたパス情報に基づいて、記録媒体に記録されたデータファイルにアクセスする。
The
図3に示すようにバックアップ部60は、トリガ条件記憶部102(図中、「トリガ条件」と示す)と、制御部104と、複製部106と、ファイル情報取得部108と、ファイル情報記憶部110(図中、「ファイル情報」と示す)と、数決定条件記憶部112(図中、「数決定条件」と示す)と、複製数決定部114と、格納部120と、媒体情報取得部122と、媒体情報記憶部124(図中、「媒体情報」と示す)と、格納先選択条件記憶部126(図中、「格納先選択条件」と示す)と、格納先選択部128と、を備えている。
As shown in FIG. 3, the
トリガ条件記憶部102は、複製部106がデータファイルの複製を生成するタイミングとなるトリガを記憶する。トリガ条件とは、たとえば、データファイルの格納時、更新時、定期的、保守作業発生時、災害、警報、ネットワークやストレージの故障などのイベント発生時などを複製のトリガとした複製ファイルを生成するタイミングを示す。また、ストレージおよびネットワークの利用状況、たとえば、性能に対する負荷、累積、短期間、ファイル単位、ディスク単位、組織または地域単位などのアクセス頻度、ストレージ容量の空きの増減の変化量などを条件とすることもできる。あるいは、データファイルにアクセス可能か否かを定期的または随時確認し、アクセス不可の場合をトリガとすることもできる。これらのトリガ条件は、複数の条件を組み合わせたり、優先順位を設けたりすることもできる。
The trigger
制御部104は、トリガ条件記憶部102にアクセスし、トリガ条件を満たしているか否かを判定し、トリガ条件を満たしていると判定した時、複製部106にデータファイルの複製を生成させる。あるいは、クライアント装置10のユーザあるいはサーバ装置12の管理者からの指示を後述する指示受付部が受け付け、制御部104に通知することにより、データファイルの複製を行うこともできる。
The
複製部106は、データファイルの複製ファイルを生成する。複製部106は、管理部24から、複製元のデータファイルの管理用ファイルを取得し、管理用ファイルに含まれるパス情報からデータファイルの格納先を取得し、パス情報に基づいて、アクセス部20を介してデータファイルにアクセスして複製を生成する。
The
ファイル情報取得部108は、複製部106から複製元データファイルの格納先を取得し、アクセス部20を介して格納先にアクセスし、複製元データファイルに関する情報(以下、「ファイル情報」と呼ぶ)を取得する。ここで、ファイル情報とは、データファイルの属性情報を含み、たとえば、ファイルサイズ、生成時刻、更新時刻、オーナーなどの属性である。さらに、格納情報の種類を含むこともできる。すなわち、失われては困る情報を含むかどうかを示すファイルの重要度、個人情報、著作権、機密情報など必要な安全性の指標、人気度などにより格納情報の種類を分類し、ランク付けすることができる。なお、ファイル情報は、複製する都度取得して使用してもよいし、定期的または随時取得して記憶しておいた情報を使用してもよい。
The file
これらのファイル情報は、ファイル情報取得部108がアクセス部20を介して処理装置16の記録部42に記録されているデータファイルにアクセスして取得することができる。
The file information can be acquired by the file
ファイル情報記憶部110は、ファイル情報取得部108が取得した複製元のデータファイルに関する情報を記憶する。あるいは、予めファイル情報を登録する登録部(不図示)を含むこともできる。そして、サーバ装置12の管理者などが、予め登録部を使用して、ファイル情報記憶部110のファイル情報を登録することができる。
The file
数決定条件記憶部112は、複製数決定部114が複製数を決定する際に使用する複製数決定条件を記憶する。たとえば、ファイルサイズが所定値以上の場合は、複製数を3つにし、所定値未満の場合は複製数を2つにするなどファイルサイズ範囲と複製数を対応付けたテーブルや、ファイルの重要度が所定レベル以上の場合、複製数を3つにし、所定レベル未満の場合は複製数を2つにするなど、重要度レベル範囲と複製数を対応付けたテーブルなどを含むことができる。複製数決定条件は、複数の条件を組み合わせたり、優先順位を設けたりすることもできる。 The number determination condition storage unit 112 stores a copy number determination condition used when the copy number determination unit 114 determines the copy number. For example, if the file size is greater than or equal to a predetermined value, the number of replicas is three, and if it is less than the predetermined value, the number of replicas is two. If the value is equal to or higher than a predetermined level, the number of replicas is set to three, and if the level is less than the predetermined level, the number of replicas is set to two. As the condition for determining the number of replicas, a plurality of conditions can be combined or a priority order can be set.
複製数決定部114は、ファイル情報記憶部110に記憶されている複製元のデータファイルの属性情報に基づいて、数決定条件記憶部112に記憶されている複製数決定条件に従って、複製数を決定する。複製数決定部114によって、使用する複製数決定条件は、後述するように、クライアント装置10のユーザやサーバ装置12の管理者などによって指定することもできる。複製部106は、複製数決定部114が決定した複製数分の複製ファイルを生成する。
The number-of-replications determination unit 114 determines the number of copies in accordance with the number-of-replications determination conditions stored in the number determination condition storage unit 112 based on the attribute information of the data file of the replication source stored in the file
格納部120は、複製部106が生成した複製ファイルを格納先選択部128が選択した格納先にアクセス部20を介して格納する。格納部120が複製ファイルを格納したとき、管理部24にその旨を通知する。管理部24は、格納部120からの通知を受けて、複製ファイルの格納先のパス情報を取得し、生成部26が管理用ファイルを生成し、記録部14に記録する。
The
媒体情報取得部122は、データファイルの格納先となる複数の記録部42の性能または特性に関する情報を取得する。媒体情報記憶部124は、媒体情報取得部122が取得した情報を記憶する。
The medium
性能情報とは、たとえば、記録部42の空き容量、アクセス性能、アクセスCPUの性能、利用者とのネットワーク的な設置場所などである。これらの性能情報は、たとえば、記録部42の空き容量であれば、記録部42を使用してデータ処理を行うデータ処理装置にネットワークを介して問い合わせることにより取得することができる。また、アクセス性能は、実際に記録部42にネットワーク18を介してアクセスし、その応答時間を計測し、取得することができる。また、利用者とのネットワーク的な設置場所は、利用者のクライアント装置10からネットワーク18を介して問い合わせ信号を送信し、その応答時間を計測することにより取得することができる。格納先選択部128は、これらの性能情報が所定の条件を満たしている記録部42を格納先として選択する。
The performance information is, for example, the free capacity of the
また、特性情報とは、記録部42の信頼性、そのファイルシステムのMTBF、MTTR、UPSの有無などである。さらに、地理的、ネットワーク的な設置距離間隔、設置場所の安全性、たとえば、設置状況、構造、災害頻度、物理的な安全性、たとえば、警備状況、ストレージの容量当たりのコストパフォーマンスなどを含むことができる。
The characteristic information includes the reliability of the
たとえば、地理的な設置距離間隔が所定距離以上のノードや、安全性の高い設置場所のもの、構造上の強度が高いもの、コストが安い、利用者とのネットワーク的な設置場所が便利などを条件とすることができる。これらの情報は、複数の記録部42毎に、各属性についてランク付けすることもできる。格納先選択部128は、このランク付けを利用して格納先を選択することもできる。また、格納先選択部128が選択に使用する条件を、ユーザや管理者から指定することもできる。
For example, a node with a geographical distance of more than a predetermined distance, a highly secure installation location, a high structural strength, a low cost, a convenient network installation location with users, etc. It can be a condition. These pieces of information can also be ranked for each attribute for each of the plurality of
特性情報に対する条件は、複数の条件を組み合わせたり、優先順位を設けたりすることもできる。さらに、上述のデータファイルの属性を条件として、格納先を決定することができる。なお、特性情報は、複製する都度取得して使用してもよいし、定期的または随時取得して記憶しておいた情報を使用してもよい。 The condition for the characteristic information can be a combination of a plurality of conditions or a priority order. Furthermore, the storage destination can be determined on the condition of the attribute of the data file described above. The characteristic information may be acquired and used every time it is copied, or information acquired and stored periodically or as needed may be used.
格納先選択条件記憶部126は、所定の格納先選択条件を記憶する。性能情報に対する条件は、たとえば、複数の条件を組み合わせたり、優先順位を設けたりすることもできる。さらに、上述のデータファイルの属性を条件として、格納先を決定することができる。なお、性能情報は、複製する都度取得して使用してもよいし、定期的または随時取得して記憶しておいた情報を使用してもよい。
The storage location selection
また、特性情報に対する条件も、複数の条件を組み合わせたり、優先順位を設けたりすることもできる。さらに、上述のデータファイルの属性を条件として、格納先を決定することができる。なお、特性情報は、複製する都度取得して使用してもよいし、定期的または随時取得して記憶しておいた情報を使用してもよい。 Also, the condition for the characteristic information can be a combination of a plurality of conditions or can be given a priority order. Furthermore, the storage destination can be determined on the condition of the attribute of the data file described above. The characteristic information may be acquired and used every time it is copied, or information acquired and stored periodically or as needed may be used.
格納先選択部128は、媒体情報記憶部124に記憶されている情報に基づいて、格納先選択条件記憶部126に記憶されている所定の格納先選択条件を満たしている格納先の記録部42を選択する。
The storage
図4は、本実施形態のデータ処理システム100において、複製するデータファイルや、その格納先を指定する構成を示す機能ブロック図である。
FIG. 4 is a functional block diagram showing a configuration for designating a data file to be copied and its storage destination in the
サーバ装置12は、表示部130と、操作部132と、提示部134と、指示受付部136と、をさらに含む。提示部134は、ファイル情報記憶部110に記憶されているデータファイルの属性情報や、媒体情報記憶部124に記憶されている性能情報および/または特性情報を提示する。これらの情報は、表示部130の画面上に表示することができる。あるいは、図1のアクセス部20を介して、ネットワーク18上のクライアント装置10の表示部に表示することができる。提示部134は、データ処理システム100の管理者が提供するポータルサイトによって実現することができる。
指示受付部136は、操作部132およびアクセス部20を介してネットワーク18上のクライアント装置10の操作部からの指示を受け付け、制御部104に通知する。指示受付部136が受け付ける指示は、複製元のデータファイルの格納先、複製ファイルの複製数、複製ファイルの格納先などである。あるいは、複製ファイルを格納する格納先を決定する際に使用する格納先選択条件を指定することもできる。
The
すなわち、サーバ装置12の管理者やクライアント装置10のユーザは、提示部134によって提示された情報を参照し、データファイルの属性情報や、格納先の記録部42の性能や特性に関する情報に基づいて判断して、複製数や格納先を決定し、操作部を介して指示を行う。指示を指示受付部136が受け付け、制御部104に通知し、データファイルの複製および格納処理が行われることとなる。
That is, the administrator of the
このように構成されたデータ処理システム100の動作について、以下に説明する。図5は、本実施形態のデータ処理システム100の動作の一例を示すフローチャートである。以下、図1乃至図5を用いて説明する。
The operation of the
制御部104が、トリガ条件記憶部102に記憶されているトリガ条件に従って、複製タイミングであるか否かを判定する(ステップS11)。複製タイミングであると判定された場合(ステップS11のYES)、制御部104は、複製部106に通知し、複製部106からファイル情報取得部108に対してファイル情報の取得を指示する。なお、制御部104は、図4の指示受付部136が受け付けた指示に基づいて、複製部106に複製数および格納先の指示を通知することもできる。
The
ファイル情報取得部108は、複製部106から複製元データファイルの格納先を取得し、アクセス部20を介して格納先にアクセスし、複製元データファイルに関する情報を取得する(ステップS13)。取得した情報はファイル情報記憶部110に記憶される。つづいて、ファイル情報取得部108からの通知を受けて、複製数決定部114がファイル情報記憶部110に記憶されている複製元のデータファイルの属性情報に基づいて、数決定条件記憶部112に記憶されている複製数決定条件に従って、複製数を決定する(ステップS15)。決定した複製数は、複製部106に通知される。
The file
なお、ファイル情報取得部108によるファイル情報の取得は、必ずしも行う必要はなく、ファイル情報記憶部110に既に記憶されている情報を用いてもよい。
The file information acquisition by the file
つづいて、複製部106からの指示を受けて、格納部120が媒体情報取得部122に媒体情報の取得を指示する。媒体情報取得部122は、データファイルの格納先となる複数の記録部42の性能または特性に関する情報をアクセス部20を介して取得する(ステップS17)。あるいは、図示されない登録部から取得する。媒体情報取得部122が取得した媒体情報は、媒体情報記憶部124に記憶される。格納先選択部128は、格納先選択条件記憶部126からの通知を受けて、格納先選択条件記憶部126にアクセスし、所定の格納先選択条件を満たしている格納先の記録部42を選択する(ステップS19)。
Subsequently, in response to an instruction from the
つづいて、複製部106は、複製数決定部114が決定した複製数の複製ファイルを生成し(ステップS21)、格納部120が、格納先選択部128により選択された格納先に複製ファイルを格納する(ステップS23)。
Subsequently, the
つづいて、複製部106および格納部120からの通知を受けて、管理部24が複製ファイルの格納先のパス情報を取得する(ステップS25)。つづいて、生成部26が、パス情報を含む管理用ファイルを生成し、記録部42で記録されている複製ファイルのパス情報を含んだ管理用ファイルを生成し、管理部24が、管理用ファイルを記録部14の所定のディレクトリに配置させ、さらに、複数のディレクトリの管理すべき階層構造を形成する複数のディレクトリの情報を管理用ファイルとともに記録部14に記録する(ステップS27)。
Subsequently, upon receiving notifications from the
このように、ネットワーク18上の複数のノードの記録部42にデータファイルの複製を所定の条件に従って分散させて格納することができ、管理用ファイルを更新することができるので、複製ファイルも同様にサーバ装置12によって管理することが可能となる。このような複製ファイルの作成は、以下に説明するように、データファイルのバックアップの作成や、信頼性の向上、アクセス性能の向上などのために行われる。
In this manner, data file replicas can be distributed and stored in the
以下に、本実施形態のデータ処理システム100において、データファイルのバックアップを作成する場合の動作の実施例について説明する。
Hereinafter, an example of an operation when creating a backup of a data file in the
たとえば、クライアント装置10のユーザまたはサーバ装置12の管理者の指示により、所定のデータファイルの複製を作成する指示を指示受付部136が受け付ける。ここで、指示受付部136は、複製元のデータファイルの格納先と、複製数と、を受け付ける。ここでは、指示受付部136は、複製ファイルの格納先も受け付ける。なお、複製ファイルの格納先は、格納先選択部128に自動的に最適な格納先を選択させることにより決定することもできる。複製部106は、指示受付部136が受け付けた複製数でデータファイルを複製し、指示受付部136が受け付けた格納先に格納部120が格納する。そして生成部26が複製ファイルの管理用ファイルを生成し、管理部24が管理する。
For example, the
他の実施例において、指示受付部136は、複製元のデータファイルを受け付け、複製数決定部114がそのデータファイルの属性情報に基づいて、そのファイルサイズが所定値以上の場合は複製数を2つに決定し、所定値未満の場合は複製数を3つに決定する。なお、ファイルサイズは、複製時にデータファイルが記録されている記録部42を備えた処理装置16に問い合わせて取得することもできる。
In another embodiment, the
さらに他の実施例において、複製ファイルの格納先のノード、ドメイン名、ネットワークアドレス、複製先ノードの属性、状態などの指定を指示受付部136が受け付け、格納先選択部128が受け付けた指定に従って、格納先を選択することもできる。すなわち、格納先選択部128は、格納先選択条件記憶部126の中から指示受付部136が受け付けた指定に該当する格納先選択条件に従って、格納先を選択する。
In yet another embodiment, the
また、他の実施例において、格納先選択部128は、格納先選択条件記憶部126に記憶されている格納先選択条件に従って、自動的に格納先を選択することができる。媒体情報記憶部124に記憶されている記録部42の特性および性能に関する情報を利用して、格納先選択条件記憶部126に記憶されている条件に従って決定する。ここで、媒体情報記憶部124に記憶されている情報は、たとえば、複数のノードを条件に従ってランク付けして記憶することもできる。
In another embodiment, the storage
次に、本実施形態のデータ処理システム100において、リソースの信頼性を向上させるために複製を作成する場合の実施例を説明する。
Next, in the
たとえば、指示受付部136が複製元のデータファイルを受け付けた時、複製数決定部114が格納先のファイルシステムのMTBFなどに応じて、複製ファイルの複製数を決定する。すなわち、複製数決定部114は、該当するファイルシステムのMTBFが所定値以上の場合は複製数を2つに決定し、所定値未満の場合は複製数を3つに決定する。これにより、MTBFが所定値未満の場合は、複製数を増やすことにより、データファイルの消失などの危険性を低減することができる。
For example, when the
他の実施例において、制御部104は、複製ファイルに対して定期的にアクセス可能か否かをチェックし、アクセスできなかった場合に、他のノードへの新規複製ファイル生成を指示する。これにより、バックアップファイルの破損やアクセス不能状態などを事前に検知して、対策を講じることができる。
In another embodiment, the
さらに、本実施形態のデータ処理システム100において、アクセス性能を向上させるために複製ファイルを作成する場合の動作の実施例を説明する。
Furthermore, an example of the operation when creating a duplicate file in order to improve access performance in the
たとえば、複製元のデータファイルのアクセス頻度、ファイルサイズなどのファイル属性のランクに基づいて、複製数決定部114が複製数を決定する。たとえば、複製数決定部114は、アクセス頻度が所定ランク以上の場合、複製数を3とし、所定ランク未満の場合は複製数を2に決定する。これにより、アクセス頻度が高いデータファイルの複製数を増やすことができるので、ファイルへのアクセスの集中を分散させることができる。これにより、アクセス頻度が一定の記録媒体やデータファイルに集中しないので、処理速度の向上や、記録媒体の寿命を延ばすことが可能となる。 For example, the copy number determination unit 114 determines the copy number based on the rank of file attributes such as the access frequency and file size of the copy source data file. For example, the copy number determination unit 114 sets the copy number to 3 when the access frequency is equal to or higher than a predetermined rank, and determines the copy number to be 2 when the access frequency is less than the predetermined rank. As a result, the number of replicas of data files with high access frequency can be increased, so that the concentration of access to the files can be distributed. As a result, since the access frequency is not concentrated on a recording medium or data file, the processing speed can be improved and the life of the recording medium can be extended.
他の実施例において、トリガ条件記憶部102が定期的またはアクセス頻度が閾値を超えたとき、複製指示を行ってもよい。さらに、複製ファイルの格納先は、格納先選択部128が自動的に選択することができる。このようにして生成された複製ファイルが格納先に格納されると、管理部24は、複製ファイルの管理用ファイルを生成部26に生成させ、管理する。
In another embodiment, the trigger
また、他の実施例において、媒体情報取得部122がネットワーク18を介して各ノードにアクセスし、その応答時間を計測し、格納先選択部128が、応答時間が閾値以下のノードを格納先として選択することができる。これにより、データファイルのアクセス時に、ユーザが通信トラフィックによるストレスをなるべく感じないで済むように、通信効率のよいノードに複製を保持させることができる。
In another embodiment, the medium
以上説明したように、本発明の実施の形態のデータ処理システム100によれば、ネットワーク上の複数の記録部42にデータファイルの複製を所定の条件に従って分散させて格納することができるので、効率よく、資源の安全性および信頼性の確保およびアクセス性能の向上を図ることができる。
As described above, according to the
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。 As mentioned above, although embodiment of this invention was described with reference to drawings, these are the illustrations of this invention, Various structures other than the above are also employable.
たとえば、制御部104がトリガ条件記憶部102に記憶されているトリガ条件を満たしていると判定した時、データファイルの複製の生成を促すメッセージをクライアント装置10のユーザまたはサーバ装置12の管理者に報知する報知部(不図示)を含むことができる。ここで、報知部は、データ処理システム100のポータルサイト上にメッセージやマークを表示したり、メッセージを含むメールを予め登録されているユーザアカウントに送信したり、音声出力やLEDやランプ表示などを含むことができる。ユーザまたは管理者は、通知を受けて、操作部132を使用して複製指示を行うことができ、指示受付部136が受け付けた複製指示に呼応して、複製部106がデータファイルを複製し、格納部120が複製ファイルを格納先に格納することができる。
For example, when the
この構成によれば、データファイルの複製タイミングを知らせることができるので、適切なタイミングで効率よく資源の安全性および信頼性の確保およびアクセス性能の向上を図ることが可能となる。 According to this configuration, it is possible to notify the duplication timing of the data file, so that it is possible to efficiently ensure the safety and reliability of resources and improve the access performance at an appropriate timing.
10 クライアント装置
12 サーバ装置
12 当該サーバ装置
14 記録部
16 処理装置
18 ネットワーク
20 アクセス部
22 受付部
24 管理部
26 生成部
28 決定部
30 指示部
40 処理部
42 記録部
50 管理用ファイル
60 バックアップ部
100 データ処理システム
102 トリガ条件記憶部
104 制御部
106 複製部
108 ファイル情報取得部
110 ファイル情報記憶部
112 数決定条件記憶部
114 複製数決定部
120 格納部
122 媒体情報取得部
124 媒体情報記憶部
126 格納先選択条件記憶部
128 格納先選択部
130 表示部
132 操作部
134 提示部
136 指示受付部
DESCRIPTION OF SYMBOLS 10
Claims (8)
前記複数のデータファイルにアクセスするためのパス情報を含んだ複数の管理用ファイルをそれぞれ生成する生成部と、
前記複数のデータファイルを前記管理用ファイルにより管理し、当該複数のデータファイルのそれぞれに対応した前記管理用ファイルを所定のディレクトリに配置させ、さらに前記ディレクトリを含んだ複数のディレクトリを階層構造によって論理的に管理する管理部と、
前記データファイルの複製ファイルを生成する複製部と、
所定のトリガ条件を満たしているか否かを判定する判定部と、
前記判定部が前記トリガ条件を満たしていると判定した時、前記データファイルの複製の生成を促すメッセージをユーザに報知する報知部と、
複製元の前記データファイルの属性情報を取得する属性情報取得部と、
前記属性情報に基づいて、所定の複製数決定条件に従って前記複製ファイルの複製数を決定する複製数決定部と、
前記複製数の前記複製ファイルを格納する格納先のノードを所定の条件に従って選択する格納先選択部と、
前記複製元の前記データファイルの前記属性情報を提示する情報提示部と、
前記報知部の前記報知を受けた前記ユーザが、前記情報提示部が提示した前記データファイルの前記属性情報を参照して決定した、複製指示を受け付ける指示受付部と、
前記格納先選択部が選択した前記格納先に前記複製ファイルを格納する格納部と、
を備え、
前記指示受付部が受け付けた前記複製指示に呼応して、
前記複製部が、前記複製ファイルを前記複製数決定部が決定した前記複製数分、生成し、
前記格納部が、前記格納先選択部が選択した前記格納先に、前記複製部が生成した前記複製数の前記複製ファイルを格納し、
前記生成部が、前記複製部が前記データファイルを前記複製数複製し、前記格納部が前記格納先に前記複製ファイルを格納した時、当該複製ファイルのパス情報を含む前記管理用ファイルを生成し、
前記アクセス部が、前記複数のディレクトリからなる前記階層構造の中の前記管理用ファイルに含まれた前記パス情報に基づいて、前記記録媒体に記録された前記データファイルにアクセスすることを特徴とするデータ管理装置。 An access unit for accessing a plurality of data files respectively recorded on a plurality of recording media included in a plurality of nodes via a network;
A generating unit that generates a plurality of management files each including path information for accessing the plurality of data files;
The plurality of data files are managed by the management file, the management file corresponding to each of the plurality of data files is arranged in a predetermined directory, and the plurality of directories including the directory are logically structured by a hierarchical structure. The management department to manage automatically,
A duplicating unit for creating a duplicating file of the data file;
A determination unit for determining whether or not a predetermined trigger condition is satisfied;
When the determination unit determines that the trigger condition is satisfied, a notification unit that notifies a user of a message that prompts generation of a copy of the data file;
An attribute information acquisition unit for acquiring attribute information of the data file of the copy source;
Based on the attribute information, a replication number determination unit that determines the replication number of the replication file according to a predetermined replication number determination condition;
A storage destination selection unit for selecting a storage destination node for storing the number of copies of the duplicate file according to a predetermined condition;
An information presentation unit for presenting the attribute information of the data file of the replication source;
An instruction receiving unit for receiving a duplication instruction determined by the user who has received the notification from the notification unit with reference to the attribute information of the data file presented by the information presentation unit;
A storage unit for storing the duplicate file in the storage destination selected by the storage destination selection unit;
With
In response to the copy instruction received by the instruction receiving unit,
The duplication unit generates the duplicate files for the number of duplications determined by the duplication number determination unit,
The storage unit stores, in the storage destination selected by the storage destination selection unit, the number of replica files generated by the replica unit, and
The generation unit generates the management file including path information of the duplicate file when the duplicate unit duplicates the number of copies of the data file and the storage unit stores the duplicate file in the storage destination. ,
The access unit accesses the data file recorded on the recording medium based on the path information included in the management file in the hierarchical structure including the plurality of directories. Data management device.
前記格納先選択部は、
前記複数のノードの前記記録媒体の性能を示す性能情報を前記ネットワークを介して問い合わせて取得する性能情報取得部と、
前記性能情報に基づいて、所定の格納条件を満たしている前記格納先のノードを選択する選択部と、
を含むことを特徴とするデータ管理装置。 The data management device according to claim 1,
The storage destination selection unit
A performance information acquisition unit that inquires and acquires performance information indicating the performance of the recording medium of the plurality of nodes via the network;
A selection unit that selects the storage destination node that satisfies a predetermined storage condition based on the performance information;
A data management device comprising:
前記複数のノードの前記記録媒体の特性に関する特性情報を登録する登録部をさらに含み、
前記格納先選択部は、
前記特性情報を前記登録部に問い合わせて取得する特性情報取得部と、
前記特性情報に基づいて、所定の格納条件を満たしている前記格納先のノードを選択する選択部と、
を含むことを特徴とするデータ管理装置。 In the data management device according to claim 1 or 2,
A registration unit for registering characteristic information related to characteristics of the recording medium of the plurality of nodes;
The storage destination selection unit
A characteristic information acquisition unit that acquires the characteristic information by inquiring of the registration unit;
A selection unit for selecting the storage destination node that satisfies a predetermined storage condition based on the characteristic information;
A data management device comprising:
前記トリガ条件は、前記格納部による前記データファイルの格納時、更新時、定期的、保守作業発生時、災害、警報、ネットワークまたはストレージの故障のイベント発生時を複製のトリガとした前記複製ファイルを生成するタイミングを含むことを特徴とするデータ管理装置。 The data management device according to any one of claims 1 to 3,
The trigger condition is that the replication file is a replication trigger when the data file is stored, updated, regularly, maintenance work occurs, disaster, alarm, network or storage failure event occurs by the storage unit. A data management device including generation timing.
前記指示受付部は、前記複製指示として、前記報知部の前記報知を受けた前記ユーザが、前記情報提示部が提示した前記データファイルの前記属性情報を参照して決定した、複製元のデータファイルの格納先、および当該複製元のデータファイルの複製数を受け付け、
前記複製部は、前記指示受付部が受け付けた前記複製指示に呼応して、前記指示受付部が受け付けた前記格納先の前記複製元のデータファイルの複製ファイルを、前記指示受付部が受け付けた前記複製数分、生成することを特徴とするデータ管理装置。 The data management device according to any one of claims 1 to 4,
The instruction accepting unit, as the duplication instruction, is a duplication source data file determined by the user who has received the notice from the notifying unit with reference to the attribute information of the data file presented by the information presenting unit Storage location and the number of copies of the original data file,
In response to the replication instruction received by the instruction reception unit, the replication unit receives a replication file of the replication source data file at the storage destination received by the instruction reception unit. A data management apparatus that generates as many copies as the number of copies.
前記情報提示部は、前記性能情報取得部が取得した前記性能情報または前記特性情報取得部が取得した前記特性情報をさらに提示し、
前記指示受付部は、前記複製指示として、前記ユーザが、前記情報提示部が提示した前記性能情報または前記特性情報を参照して決定した、前記複製ファイルの前記格納先を受け付け、
前記格納部は、前記指示受付部が受け付けた前記複製指示に呼応して、前記指示受付部が受け付けた前記格納先に前記複製ファイルを格納することを特徴とするデータ管理装置。 The data management device according to any one of claims 2 to 5,
The information presentation unit further presents the performance information acquired by the performance information acquisition unit or the characteristic information acquired by the characteristic information acquisition unit,
The instruction accepting unit accepts the storage location of the duplicate file determined by the user with reference to the performance information or the characteristic information presented by the information presenting unit as the duplication instruction,
The data storage device, wherein the storage unit stores the duplicate file in the storage destination accepted by the instruction accepting unit in response to the duplication instruction accepted by the instruction accepting unit.
前記複数のデータファイルにアクセスするためのパス情報を含んだ複数の管理用ファイルをそれぞれ生成する生成部と、
前記複数のデータファイルを前記管理用ファイルにより管理し、当該複数のデータファイルのそれぞれに対応した前記管理用ファイルを所定のディレクトリに配置させ、さらに前記ディレクトリを含んだ複数のディレクトリを階層構造によって論理的に管理する管理部とを備え、
前記アクセス部が、前記複数のディレクトリからなる前記階層構造の中の前記管理用ファイルに含まれた前記パス情報に基づいて、前記記録媒体に記録された前記データファイルにアクセスするデータ管理装置におけるデータ管理方法であって、
前記データ管理装置が、
所定のトリガ条件を満たしているか否かを判定するステップと、
前記判定するステップで前記トリガ条件を満たしていると判定した時、前記データファイルの複製の生成を促すメッセージをユーザに報知するステップと、
複製元の前記データファイルの属性情報を取得するステップと、
前記属性情報に基づいて、所定の複製数決定条件に従って複製ファイルの複製数を決定するステップと、
前記複製数の前記複製ファイルを格納する格納先のノードを所定の条件に従って選択するステップと、
前記複製元の前記データファイルの前記属性情報を提示するステップと、
前記報知するステップの前記報知を受けて前記ユーザが、前記属性情報を提示するステップで提示された前記データファイルの前記属性情報を参照して決定した、複製指示を受け付けるステップと、
前記複製指示を受け付けるステップで受け付けた前記複製指示に呼応して、前記複製ファイルを前記複製数を決定するステップで決定した前記複製数分、生成するステップと、
前記格納先を選択するステップで選択した前記格納先に、生成された前記複製数の前記複製ファイルを格納するステップと、
前記複製ファイルを生成するステップで前記データファイルが前記複製数複製され、前記格納するステップで前記格納先に前記複製ファイルを格納された時、当該複製ファイルのパス情報を含む前記管理用ファイルを生成するステップと、を順に行うことを特徴とするデータ管理方法。 An access unit for accessing a plurality of data files respectively recorded on a plurality of recording media included in a plurality of nodes via a network ;
A generating unit that generates a plurality of management files each including path information for accessing the plurality of data files;
The plurality of data files are managed by the management file, the management file corresponding to each of the plurality of data files is arranged in a predetermined directory, and the plurality of directories including the directory are logically structured by a hierarchical structure. With a management unit that manages
Data in a data management device in which the access unit accesses the data file recorded on the recording medium based on the path information included in the management file in the hierarchical structure including the plurality of directories. A management method,
Before Symbol data management device,
Determining whether a predetermined trigger condition is satisfied;
When determining that the trigger condition is satisfied in the determining step, notifying the user of a message prompting generation of a copy of the data file;
Obtaining attribute information of the data file of the replication source;
Based on the attribute information and determining the number of copies of the duplication files in accordance with predetermined copy number determination condition,
Selecting a storage destination node for storing the number of copies of the duplicate file according to a predetermined condition;
Presenting the attribute information of the data file of the replication source;
Receiving the notification in the notifying step, receiving a replication instruction determined by the user with reference to the attribute information of the data file presented in the step of presenting the attribute information;
In response to the copy instruction received in the step of receiving the copy instruction, generating the copy file for the number of copies determined in the step of determining the number of copies;
Storing the duplicate files of the number of duplicates generated in the storage destination selected in the step of selecting the storage destination;
When the number of copies of the data file is duplicated in the step of creating the duplicate file and the duplicate file is stored in the storage destination in the storing step, the management file including path information of the duplicate file is created. data management method according to claim rows Ukoto steps, in this order to.
前記複数のデータファイルに、前記ネットワークを介してアクセスする手段と、
前記複数のデータファイルにアクセスするためのパス情報を含んだ複数の管理用ファイルをそれぞれ生成する手段と、
前記複数のデータファイルを前記管理用ファイルにより管理し、当該複数のデータファイルのそれぞれに対応した前記管理用ファイルを所定のディレクトリに配置させ、さらに前記ディレクトリを含んだ複数のディレクトリを階層構造によって論理的に管理する手段と、
前記データファイルの複製ファイルを生成する手段と、
所定のトリガ条件を満たしているか否かを判定する手段と、
前記判定する手段が前記トリガ条件を満たしていると判定した時、前記データファイルの複製の生成を促すメッセージをユーザに報知する手段と、
複製元の前記データファイルの属性情報を取得する手段と、
前記属性情報に基づいて、所定の複製数決定条件に従って前記複製ファイルの複製数を決定する手段と、
前記複製数の前記複製ファイルを格納する格納先のノードを所定の条件に従って選択する手段と、
前記複製元の前記データファイルの前記属性情報を提示する手段と、
前記報知する手段の前記報知を受けて前記ユーザが、前記提示する手段が提示した前記データファイルの前記属性情報を参照して決定した、複製指示を受け付ける手段と、
前記複製指示を受け付ける手段が受け付けた前記複製指示に呼応して、前記複製ファイルを生成する手段に、前記複製数を決定する手段が決定した前記複製数分、前記複製ファイルを生成させる手段と、
前記格納先を選択する手段が選択した前記格納先に、生成された前記複製数の前記複製ファイルを格納する手段と、
前記複製ファイルを生成する手段が前記データファイルを前記複製数複製し、前記格納する手段が前記格納先に前記複製ファイルを格納した時、当該複製ファイルのパス情報を含む前記管理用ファイルを生成する手段と、
前記複数のディレクトリからなる前記階層構造の中の前記管理用ファイルに含まれた前記パス情報に基づいて、前記記録媒体に記録された前記データファイルにアクセスする手段、
として機能させることを特徴とするプログラム。 A data management computer for accessing a plurality of data files respectively recorded on a plurality of recording media included in a plurality of nodes via a network;
Means for accessing the plurality of data files via the network;
Means for generating a plurality of management files each including path information for accessing the plurality of data files;
The plurality of data files are managed by the management file, the management file corresponding to each of the plurality of data files is arranged in a predetermined directory, and the plurality of directories including the directory are logically structured by a hierarchical structure. Means to manage automatically,
Means for generating a duplicate file of the data file;
Means for determining whether or not a predetermined trigger condition is satisfied;
Means for notifying a user of a message prompting generation of a duplicate of the data file when the determining means determines that the trigger condition is satisfied;
Means for obtaining attribute information of the data file of the copy source;
Means for determining the number of replicas of the replica file according to a predetermined replica number determination condition based on the attribute information;
Means for selecting, according to a predetermined condition, a storage destination node for storing the number of replica files;
Means for presenting the attribute information of the data file of the replication source;
Means for receiving a duplication instruction determined by the user with reference to the attribute information of the data file presented by the presenting means upon receiving the notice from the notifying means;
In response to the copy instruction received by the means for receiving the copy instruction, the means for generating the copy file generates the copy file for the number of copies determined by the means for determining the copy number;
Means for storing, in the storage destination selected by the means for selecting the storage destination, the duplicate files of the generated number of replicas;
When the means for generating the duplicate file duplicates the number of copies of the data file, and the means for storing stores the duplicate file at the storage destination, the management file including path information of the duplicate file is created. Means,
Means for accessing the data file recorded on the recording medium based on the path information included in the management file in the hierarchical structure comprising the plurality of directories;
A program characterized by functioning as
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005172873A JP4784854B2 (en) | 2005-06-13 | 2005-06-13 | Data management apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005172873A JP4784854B2 (en) | 2005-06-13 | 2005-06-13 | Data management apparatus and method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006350470A JP2006350470A (en) | 2006-12-28 |
JP4784854B2 true JP4784854B2 (en) | 2011-10-05 |
Family
ID=37646278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005172873A Expired - Fee Related JP4784854B2 (en) | 2005-06-13 | 2005-06-13 | Data management apparatus and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4784854B2 (en) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5320678B2 (en) * | 2007-02-20 | 2013-10-23 | 日本電気株式会社 | Data distribution storage system, data distribution method, apparatus used therefor, and program thereof |
JP5018403B2 (en) * | 2007-10-31 | 2012-09-05 | 日本電気株式会社 | BACKUP SYSTEM, SERVER DEVICE, BACKUP METHOD USED FOR THEM, AND PROGRAM THEREOF |
US20100268908A1 (en) * | 2007-11-22 | 2010-10-21 | China Mobile Communications Corporation | Data storage method, device and system and management server |
EP2264601B1 (en) | 2008-03-31 | 2017-12-13 | Fujitsu Limited | Integrated configuration management device, disparate configuration management device, and backup data management system |
JP5136162B2 (en) * | 2008-03-31 | 2013-02-06 | 日本電気株式会社 | Backup management system, method, and program |
US8769055B2 (en) | 2009-04-24 | 2014-07-01 | Microsoft Corporation | Distributed backup and versioning |
US8769049B2 (en) | 2009-04-24 | 2014-07-01 | Microsoft Corporation | Intelligent tiers of backup data |
US8560639B2 (en) * | 2009-04-24 | 2013-10-15 | Microsoft Corporation | Dynamic placement of replica data |
US8935366B2 (en) | 2009-04-24 | 2015-01-13 | Microsoft Corporation | Hybrid distributed and cloud backup architecture |
JP5943430B2 (en) * | 2011-03-16 | 2016-07-05 | 日本電気株式会社 | Distributed storage system and distributed storage method |
WO2013145222A1 (en) * | 2012-03-29 | 2013-10-03 | 富士通株式会社 | Information processing device and data storing processing program |
JPWO2013145222A1 (en) * | 2012-03-29 | 2015-08-03 | 富士通株式会社 | Information processing apparatus and data storage processing program |
US8903959B2 (en) * | 2013-01-08 | 2014-12-02 | Lyve Minds, Inc. | Storage network data distribution |
JP5236129B2 (en) * | 2013-02-04 | 2013-07-17 | 株式会社インテック | Storage service providing apparatus, system, service providing method, and service providing program |
JP6191171B2 (en) * | 2013-03-06 | 2017-09-06 | 富士通株式会社 | Storage system, data storage destination selection method and program |
JP5998080B2 (en) * | 2013-03-07 | 2016-09-28 | 株式会社日立製作所 | Distributed file system and data replication management control method |
JP6286251B2 (en) * | 2014-03-28 | 2018-02-28 | 株式会社日立製作所 | Distributed file system and data availability management control method thereof |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000207370A (en) * | 1999-01-20 | 2000-07-28 | Matsushita Electric Ind Co Ltd | Distributed file management device and distributed file management system |
JP4287092B2 (en) * | 2002-03-29 | 2009-07-01 | 株式会社富士通ソーシアルサイエンスラボラトリ | File management system and file management method |
US7269612B2 (en) * | 2002-05-31 | 2007-09-11 | International Business Machines Corporation | Method, system, and program for a policy based storage manager |
JP2005538467A (en) * | 2002-09-10 | 2005-12-15 | イグザグリッド システムズ, インコーポレイテッド | Method and apparatus for managing data health of backup data and disaster recovery data |
JP2004171224A (en) * | 2002-11-19 | 2004-06-17 | Nec Corp | Contract storage proxy serving system and method |
JP2004252957A (en) * | 2003-01-30 | 2004-09-09 | Hitachi Ltd | Method and device for file replication in distributed file system |
JP4238318B2 (en) * | 2003-08-15 | 2009-03-18 | 独立行政法人産業技術総合研究所 | Data management device |
-
2005
- 2005-06-13 JP JP2005172873A patent/JP4784854B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006350470A (en) | 2006-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4784854B2 (en) | Data management apparatus and method | |
US11443007B2 (en) | System and method for managing network traffic routing | |
JP4320195B2 (en) | File storage service system, file management apparatus, file management method, ID designation type NAS server, and file reading method | |
CN101568919B (en) | Single view of data in a networked computer system with distributed storage | |
US8726264B1 (en) | Architecture for incremental deployment | |
JP5937724B2 (en) | Techniques for network replication | |
AU2012206295B2 (en) | Large scale storage system | |
US7490265B2 (en) | Recovery segment identification in a computing infrastructure | |
US8234372B2 (en) | Writing a file to a cloud storage solution | |
JP5492295B2 (en) | Content mesh search | |
JP5541149B2 (en) | Snapshot collection program, server, and snapshot collection method | |
JP2014010465A (en) | Method for selecting storage cloud for storing entity file from two or more storage cloud and computer and computer program | |
JP2014056319A (en) | Information processor, program, and control method | |
JP2007509410A (en) | System and method for generating an aggregated data view in a computer network | |
US20130007091A1 (en) | Methods and apparatuses for storing shared data files in distributed file systems | |
US10095790B2 (en) | Control center system for searching and managing objects across data centers | |
WO2022127762A1 (en) | Cloud platform and bucket management method for object storage service provided thereby | |
JP5076015B1 (en) | Information processing apparatus, client management method, and client management system | |
CA3056043C (en) | A data management system and method | |
JP4241200B2 (en) | Data sharing system and method, and data sharing program | |
Emara et al. | Geographically distributed data management to support large-scale data analysis | |
JP2007200047A (en) | Access log-displaying system and method | |
US20110258215A1 (en) | Social network based information discovery about network data processing systems | |
US8001100B2 (en) | Leveraging multilevel hierarchical associations to find cross-boundary issues | |
JP2009151622A (en) | Program for connecting display zones of overlapped thumbnail and displaying thumbnail on connected display zone |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071121 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100629 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100713 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100910 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100910 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100913 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110104 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110404 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20110412 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110531 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110609 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110628 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110630 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140722 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140722 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |