KR101491911B1 - Sound acquisition system to remove noise in the noise environment - Google Patents

Sound acquisition system to remove noise in the noise environment Download PDF

Info

Publication number
KR101491911B1
KR101491911B1 KR20130074491A KR20130074491A KR101491911B1 KR 101491911 B1 KR101491911 B1 KR 101491911B1 KR 20130074491 A KR20130074491 A KR 20130074491A KR 20130074491 A KR20130074491 A KR 20130074491A KR 101491911 B1 KR101491911 B1 KR 101491911B1
Authority
KR
South Korea
Prior art keywords
sound information
sound
frequency band
generated
acquisition
Prior art date
Application number
KR20130074491A
Other languages
Korean (ko)
Other versions
KR20150011854A (en
Inventor
인경준
박대희
정용화
이종욱
Original Assignee
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단 filed Critical 고려대학교 산학협력단
Priority to KR20130074491A priority Critical patent/KR101491911B1/en
Publication of KR20150011854A publication Critical patent/KR20150011854A/en
Application granted granted Critical
Publication of KR101491911B1 publication Critical patent/KR101491911B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

주파수 영역의 크기 주파수 스펙트럼(magnitude frequency spectrum)과 시간 영역의 단시간 에너지(short-time energy)를 결합하여 획득 대상의 사운드 정보를 얻는 사운드 획득 시스템이 제공된다. 상기 사운드 획득 시스템은, 획득 대상의 사운드 정보가 발생된 주파수 대역 구간을 추출하는 추출부; 및 추출된 상기 주파수 대역 구간에 단시간 에너지(short-time energy)를 사용하여 상기 획득 대상의 상기 사운드 정보인지 판단하는 판단부를 포함할 수 있다.There is provided a sound acquisition system for acquiring sound information of an acquisition target by combining a magnitude frequency spectrum of a frequency domain with a short-time energy of a time domain. The sound acquisition system includes: an extraction unit that extracts a frequency band interval in which sound information of an acquisition object is generated; And a determination unit for determining whether the sound information of the acquisition target is information using short-time energy in the extracted frequency band section.

Description

소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템{Sound acquisition system to remove noise in the noise environment}Technical Field [0001] The present invention relates to a sound acquisition system for eliminating noise in a noise-

소음이 발생되는 환경에서 소음을 제거하는 시스템 및 방법에 연관되며, 보다 구체적으로 주파수 영역의 크기 주파수 스펙트럼(magnitude frequency spectrum)과 시간 영역의 단시간 에너지(short-time energy)를 결합하여 사운드 획득 대상의 소리 정보를 얻는 사운드 획득 시스템 및 방법이 제공된다.The present invention relates to a system and a method for eliminating noise in an environment in which noise is generated, and more particularly, to a system and method for eliminating noise in an environment in which noise is generated, A sound acquisition system and method for obtaining sound information are provided.

소리 획득 또는 음성 구간 탐지는 전체 소리 처리 과정 중에서 가장 처음 실행되어 신호를 전달하는 전처리 과정으로 소음에서 소리를 구별하는데 사용되며 특히 음성인식, 음성 코딩 및 통신 음성과 같은 많은 응용 프로그램에서 필요로 하는 기술이다. 강인한 소리 획득은 배경 소음의 다양한 유형에 따라 음성 인식률을 향상시키고 잘못된 음성 감지에 의해 유도된 계산 능력의 낭비를 줄일 수 있다.Sound acquisition or speech interval detection is the first step in the entire sound processing process to transfer the signal. It is used to distinguish sound from noise. Especially, it is necessary to use the technology required by many applications such as speech recognition, speech coding and communication voice to be. Robust sound acquisition improves the speech recognition rate according to various types of background noise and can reduce the waste of calculation ability induced by false speech detection.

소리 획득이라 함은 크게 분별력과 정확한 끝점 검출이라는 두 가지 기준에 대해 우수해야 한다. 즉, 소리 검출은 잡음과 소리를 잘 분별해야 할 뿐만 아니라, 정확한 끝점 검출을 하여 소리 정보 활용 시 발생되는 문제를 줄여야 한다.Sound acquisition should be excellent for two criteria: discrimination power and accurate endpoint detection. In other words, sound detection should not only distinguish between noise and sound, but also should reduce the problems caused by using sound information by detecting accurate end points.

소리 획득 프로세스를 위한 알고리즘은 크게 임계값에 기초한 알고리즘과 기계학습에 기반을 둔 패턴인식 기법으로 나눌 수 있다. 임계값에 기초한 알고리즘은 비교적 쉽고 간단하게 구현이 가능하나 소음에 강인하지 못하다는 단점이 있다. 반면 기계학습에 기반을 둔 패턴인식 기법은 소리 발생 구간의 특징 벡터와 소리가 아닌 구간의 특징 벡터를 SVM(Support Vector Machines)과 같은 기계학습 기법으로 학습하여 사용하는 패턴인식 기법을 말한다.The algorithms for the sound acquisition process can be roughly classified into threshold-based algorithms and pattern recognition techniques based on machine learning. Threshold-based algorithms are relatively easy and simple to implement, but they are not robust against noise. On the other hand, the pattern recognition technique based on machine learning is a pattern recognition technique that learns the feature vectors of the sound generation interval and feature vectors of the intervals using a machine learning technique such as SVM (Support Vector Machines).

소리 획득 프로세스를 위한 기존의 알고리즘은 대부분 인간의 음성 인식을 위한 전처리 알고리즘으로써, 동물의 소리 연구 영역에서도 자체의 연구결과 없이 인간 소리를 위한 알고리즘이 그대로 동물의 소리 연구에 사용하고 있다.The existing algorithms for the sound acquisition process are mostly preprocessing algorithms for human speech recognition, and the algorithms for human sounds are used in animal sound studies without any research results.

물론 일부 개를 위한 혹은 새를 위한 소리 획득 프로세스 알고리즘은 발견되나, 돼지의 소리를 위한 소리 획득 프로세스 알고리즘은 발견되지 않는다. 동물의 경우, 인간의 성도의 겉모양만 같을 뿐 내부 조직이나 기능이 달라 발성에 차이가 있다는 것은 이미 검증된 사실이다. 다루고자 하는 대상에 특화된 소리 획득 프로세스 알고리즘이 필요하다.Of course, a sound acquisition process algorithm is found for some dogs or birds, but no sound acquisition process algorithm for pig sounds is found. In the case of animals, it is already proven that there is a difference in vocalization as the internal structure or function is different only in appearance of human saints. We need a sound acquisition process algorithm that is specific to the object we are dealing with.

일측에 따르면, 획득 대상의 사운드 정보가 발생된 주파수 대역 구간을 추출하는 추출부; 및 추출된 상기 주파수 대역 구간에 단시간 에너지(short-time energy)를 사용하여 상기 획득 대상의 상기 사운드 정보인지 판단하는 판단부를 포함하는 사운드 획득 시스템이 제공된다.According to an aspect of the present invention, there is provided a sound information processing apparatus including: an extracting unit that extracts a frequency band interval in which sound information of an acquisition object is generated; And a determination unit that determines whether the extracted sound information is the sound information of the acquisition target using short-time energy in the extracted frequency band period.

일실시예에 따르면, 상기 추출부는 상기 획득 대상의 상기 사운드 정보를 취득하는 센서부; 상기 센서부에 의해 취득된 상기 사운드 정보를 나누는 프레임 분할부; 및 상기 프레임 분할부에 의해 나눠진 상기 사운드 정보를 FFT(Fast Fourier Transform)를 이용하여 크기 주파수 스펙트럼(magnitude frequency spectrum)으로 변환하는 변환부를 포함할 수 있다.According to one embodiment, the extracting unit includes: a sensor unit for acquiring the sound information of the object to be acquired; A frame dividing unit dividing the sound information acquired by the sensor unit; And a converting unit converting the sound information divided by the frame dividing unit into a magnitude frequency spectrum using an FFT (Fast Fourier Transform).

다른 실시예에 따르면, 상기 주파수 대역 구간을 추출하는 것은 상기 사운드 정보가 발생되었을 때와 상기 사운드 정보가 발생되지 않았을 때의 상기 크기 주파수 스펙트럼으로부터 추출할 수 있다.According to another embodiment, the extracting of the frequency band section may extract from the magnitude frequency spectrum when the sound information is generated and when the sound information is not generated.

또 다른 실시예에 따르면, 상기 주파수 대역 구간을 추출하는 것은 사인-거리 계산(sine-distance calculation)을 이용하고, 상기 주파수 대역 구간의 변화를 확인하여 크기(amplitude)가 임계값을 초과하는 구간을 추출할 수 있다.According to another embodiment of the present invention, the frequency band section is extracted using a sine-distance calculation, and a change in the frequency band interval is checked to determine a section in which the amplitude exceeds the threshold value Can be extracted.

또 다른 실시예에 따르면, 상기 판단부가 상기 단시간 에너지(short-time energy)를 사용하는 것은 상기 사운드 정보의 제곱값에 윈도우 함수를 곱해줌으로써 상기 획득 대상의 상기 사운드 정보인지 판단할 수 있다.According to another embodiment, the determination unit uses the short-time energy to determine whether the sound information is the sound information of the acquisition object by multiplying the square value of the sound information by a window function.

다른 일측에 따르면, 획득 대상의 사운드 정보가 발생된 주파수 대역 구간을 추출하는 단계; 및 추출된 상기 주파수 대역 구간에 단시간 에너지(short-time energy)를 사용하여 상기 획득 대상의 상기 사운드 정보인지 판단하는 단계를 포함하는 사운드 획득 방법이 제공된다.According to another aspect of the present invention, there is provided a method comprising: extracting a frequency band interval in which sound information of an acquisition object is generated; And determining whether the extracted sound information is the sound information of the object to be acquired using short-time energy in the extracted frequency band section.

일실시예에 따르면, 상기 획득 대상의 상기 사운드 정보를 취득하는 단계; 취득된 상기 사운드 정보를 나누는 단계; 및 나눠진 상기 사운드 정보를 FFT(Fast Fourier Transform)를 이용하여 크기 주파수 스펙트럼(magnitude frequency spectrum)으로 변환하는 단계를 더 포함하는 할 수 있다.According to an embodiment, the step of acquiring the sound information of the object to be acquired includes: Dividing the acquired sound information; And transforming the divided sound information into a magnitude frequency spectrum using Fast Fourier Transform (FFT).

다른 실시예에 따르면, 상기 주파수 대역 구간을 추출하는 단계는 상기 사운드 정보가 발생되었을 때와 상기 사운드 정보가 발생되지 않았을 때의 상기 크기 주파수 스펙트럼으로부터 추출할 수 있다.According to another embodiment, the step of extracting the frequency band section may extract from the magnitude frequency spectrum when the sound information is generated and when the sound information is not generated.

또 다른 실시예에 따르면, 상기 주파수 대역 구간을 추출하는 단계는 사인-거리 계산(sine-distance calculation)을 이용하고, 상기 주파수 대역 구간의 변화를 확인하여 크기(amplitude)가 임계값을 초과하는 구간을 추출할 수 있다.According to another embodiment of the present invention, the step of extracting the frequency band interval may include the steps of using a sine-distance calculation, checking a change of the frequency band interval, Can be extracted.

또 다른 실시예에 따르면, 상기 단시간 에너지(short-time energy)를 사용하여 상기 획득 대상의 상기 사운드 정보인지 판단하는 단계는 상기 사운드 정보의 제곱값에 윈도우 함수를 곱해줌으로써 상기 획득 대상의 상기 사운드 정보인지 판단할 수 있다.According to another embodiment, the step of determining whether the sound information is the sound information of the acquisition target using the short-time energy includes multiplying the square value of the sound information by a window function, .

도 1은 일실시예에 따른 소음이 발생되는 환경에서 획득 대상의 사운드 획득 과정을 설명하기 위한 개략적인 개념도이다.
도 2는 일실시예에 따른 사운드 획득 시스템의 모듈 흐름도이다.
도 3은 일실시예에 따른 소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템의 구성을 도시한 도면이다.
도 4는 일실시예에 따른 사운드 획득 시스템 추출부의 세부 구성도이다.
도 5는 일실시예에 따른 주파수 영역에서 획득 대상이 발생시키는 사운드의 신호와 소음 신호를 나타내는 그래프이다.
도 6은 일실시예에 따른 소음이 발생되는 환경에서 획득 대상의 사운드 획득 방법을 설명하기 위한 구체적인 흐름도이다.
도 7은 일실시예에 따른 획득 대상의 사운드 소리와 소음의 파형 및 스펙트럼을 나타내는 도면이다.
도 8은 일실시예에 따른 획득 대상의 사운드 파형을 나타내는 실시예를 나타내는 도면이다.
FIG. 1 is a schematic diagram for explaining a sound acquisition process in an environment in which noise is generated according to an embodiment.
2 is a module flow diagram of a sound acquisition system according to one embodiment.
3 is a diagram illustrating a configuration of a sound acquisition system for eliminating noise in an environment where noise is generated according to an embodiment.
4 is a detailed configuration diagram of a sound acquisition system extracting unit according to an embodiment.
5 is a graph showing a sound signal and a noise signal generated by an acquisition object in a frequency domain according to an embodiment.
6 is a specific flowchart for explaining a sound acquisition method in an environment in which noise is generated according to an embodiment.
7 is a diagram showing a sound sound and a noise waveform and spectrum of an object to be acquired according to an embodiment.
8 is a diagram showing an embodiment showing a sound waveform of an acquisition target according to an embodiment.

이하에서, 일부 실시예들을, 첨부된 도면을 참조하여 상세하게 설명한다. 그러나, 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.In the following, some embodiments will be described in detail with reference to the accompanying drawings. However, it is not limited or limited by these embodiments. Like reference symbols in the drawings denote like elements.

아래 설명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 관례, 새로운 기술의 출현 등에 따라 달라질 수 있다.Although the terms used in the following description have selected the general terms that are widely used in the present invention while considering the functions of the present invention, they may vary depending on the intention or custom of the artisan, the emergence of new technology, and the like.

또한 특정한 경우는 이해를 돕거나 및/또는 설명의 편의를 위해 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 설명 부분에서 상세한 그 의미를 기재할 것이다. 따라서 아래 설명에서 사용되는 용어는 단순한 용어의 명칭이 아닌 그 용어가 가지는 의미와 명세서 전반에 걸친 내용을 토대로 이해되어야 한다.Also, in certain cases, there may be terms chosen arbitrarily by the applicant for the sake of understanding and / or convenience of explanation, and in this case the meaning of the detailed description in the corresponding description section. Therefore, the term used in the following description should be understood based on the meaning of the term, not the name of a simple term, and the contents throughout the specification.

도 1은 일실시예에 따른 소음이 발생되는 환경에서 획득 대상의 사운드 획득 과정을 설명하기 위한 개략적인 개념도이다.FIG. 1 is a schematic diagram for explaining a sound acquisition process in an environment in which noise is generated according to an embodiment.

일실시예에 따라 획득 대상에서 사운드 신호가 방출(110)한다. 사운드 획득 시스템(130)은 추출부 중 센서부에서 상기 획득 대상의 사운드 정보를 수신(120)한다. 상기 센서부는 상기 획득 대상의 상기 사운드 정보 뿐만 아니라 소음도 수신할 수 있다.According to one embodiment, a sound signal is emitted (110) at the acquisition target. The sound acquisition system 130 receives (120) the sound information of the acquisition object from the sensor unit of the extraction unit. The sensor unit may receive noise as well as the sound information of the object to be acquired.

일실시예에 따라 사운드 획득 시스템(130)은 주파수 변화를 감시하는 모듈과 에너지 변화를 감시하는 모듈로 구성될 수 있다. 주파수 변화를 감시하는 모듈은 소리 정보를 취득하는 과정과 주파수를 분석하는 과정을 포함할 수 있다. 에너지 변화를 감시하는 모듈은 획득 대상의 소리를 탐지하는 과정을 포함할 수 있다According to one embodiment, the sound acquisition system 130 may include a module for monitoring a frequency change and a module for monitoring an energy change. The module for monitoring the frequency change may include a process of acquiring sound information and a process of analyzing the frequency. The module for monitoring the energy change may include a process of detecting the sound of the object to be acquired

일실시예에 따라 수신한 상기 획득 대상의 상기 사운드 정보를 프레임 분할부에서 나눌 수 있다. 상기 프레임 분할부에 의해 나눠진 상기 사운드 정보를 해밍 윈도우를 적용하여 고속 퓨리에 변환을 할 수 있다. 상기 고속 퓨리에 변환(Fast Fourier Transform)을 하여 신호를 주파수 영역으로 이동시키고 이로부터 크기 주파수 스펙트럼을 얻을 수 있다. 사운드 획득 시스템(130)은 소리 발생 시 전체 주파수 대역을 감시하는 것이 아니라 주요 주파수 대역만을 감시함으로써 소리 추출에 소요되는 시간을 단축시키며 생활 소음에 의해 발생된 소리와 획득 대상에 의해 발생된 소리를 구분하고 있다.According to an embodiment, the received sound information of the object to be acquired can be divided by the frame division unit. The sound information divided by the frame dividing unit can be subjected to fast Fourier transform by applying a hamming window. The Fast Fourier Transform may be performed to move the signal to the frequency domain and obtain a magnitude frequency spectrum therefrom. The sound acquisition system 130 monitors not only the entire frequency band but also the main frequency band, thereby shortening the time required for sound extraction and separating the sound generated by the living noise and the sound generated by the acquisition target .

구체적으로, 주요 주파수 대역을 추출하기 위해서는 획득 대상의 사운드가 발생되었을 때와 상기 획득 대상의 상기 사운드가 발생되지 않았을 때의 크기 주파수 스펙트럼을 각각 추출하여 사인-거리 계산으로 주파수 곡선의 변화가 큰 대역을 찾는다. 찾아낸 주파수 대역의 크기(amplitude) 임계값을 구하여 상기 사운드를 추출할 기준을 정할 수 있다.Specifically, in order to extract a main frequency band, a magnitude frequency spectrum when the sound of the acquisition object is generated and a sound frequency when the sound of the acquisition object is not generated are respectively extracted, and a sine- . A criterion for extracting the sound can be determined by obtaining an amplitude threshold value of the found frequency band.

일실시예에 따라 상기 추출된 주파수 대역 구간이 획득 대상에 의해 발생된 소리인지 단시간 에너지(short-time energy)를 이용하여 판단할 수 있다. 판단부가 상기 단시간 에너지(short-time energy)를 이용하는 것은 상기 사운드 정보의 제곱값에 윈도우 함수를 곱해줌으로써 상기 획득 대상의 상기 사운드 정보인지 판단하는 것이다. 상기 얻은 정보로 시간 변화에 따른 에너지 변화를 확인할 수 있다. 획득 대상의 사운드 정보를 추출하여 파일 형태로 저장(140)할 수 있다. 파일로 저장될 시 음절단위로 저장될 수 있다.According to an embodiment of the present invention, the extracted frequency band interval may be determined using sound or short-time energy generated by the object to be acquired. The determination unit uses the short-time energy to determine whether the sound information is the sound information of the acquisition object by multiplying the square value of the sound information by a window function. The obtained information can confirm the energy change with time. The sound information of the acquisition object can be extracted and stored (140) in a file format. When stored as a file, it can be stored in syllable units.

도 2는 일실시예에 따른 사운드 획득 시스템의 모듈 흐름도이다.2 is a module flow diagram of a sound acquisition system according to one embodiment.

사운드 획득 시스템(200)은 소리 특징 정보들 중, 주파수 영역의 크기 주파수 스펙트럼(magnitude frequency spectrum)과 시간 영역의 단구간 에너지(short-time energy)를 조합하여, 소음이 발생되는 환경에서도 효율적이며 정확한 소리(또는 사운드)를 획득하는 것을 목적으로 한다.The sound acquisition system 200 combines the magnitude frequency spectrum of the frequency domain and the short-time energy of the time domain among the sound feature information to obtain an efficient and accurate It is aimed to acquire sound (or sound).

구체적으로는, 시간의 변화에 따른 주파수 스펙트럼의 변화를 확인할 수 있는 크기 주파수 스펙트럼과 그에 따른 에너지의 변화를 확인할 수 있는 단구간 에너지를 결합하여 소음이 있는 환경에서 획득 대상의 사운드를 얻기 위한 것이다.Specifically, it is intended to obtain a sound of an object to be picked up in a noisy environment by combining a magnitude frequency spectrum which can confirm the change of the frequency spectrum with a change of time and a short-term energy which can confirm the change of the energy.

사운드 획득 시스템(200)은 주파수 변화를 감시하는 모듈(210)과 에너지 변화를 감시하는 모듈(220)로 구성될 수 있다. 주파수 변화를 감시하는 모듈(210)은 소리 정보를 취득하는 과정과 주파수를 분석하는 과정을 포함할 수 있다. 에너지 변화를 감시하는 모듈(220)은 획득 대상의 소리를 탐지하는 과정을 포함할 수 있다. 상기 획득 대상은 소음이 발생하는 환경에서 소음을 제거하고 소리 정보를 얻고자 하는 대상을 가리킬 수 있다.The sound acquisition system 200 may include a module 210 for monitoring a frequency change and a module 220 for monitoring an energy change. The module 210 for monitoring a frequency change may include a process of acquiring sound information and a process of analyzing a frequency. The module 220 for monitoring the energy change may include a process of detecting the sound of the acquisition target. The acquisition object may indicate an object to remove noise and obtain sound information in an environment where noise is generated.

일실시예에 따른 상기 소리 정보를 취득하는 과정은 소리 센서 또는 CCTV로부터 소리 정보를 취득할 수 있다. 상기 소리 센서를 포함하는 장치에는 일상 생활에서 사용하는 휴대 전화, 녹음기, 라디오를 포함할 수 있다. 상기 소리 정보는 소음이 발생하는 환경에서 소음을 제거한 것이다.The process of acquiring the sound information according to an embodiment may acquire sound information from a sound sensor or a CCTV. The device including the sound sensor may include a cellular phone, a sound recorder, and a radio used in daily life. The sound information is noise in an environment where noise is generated.

일실시예에 따른 상기 주파수를 분석하는 과정은 상기 소리 센서 또는 상기 CCTV로부터 입력되는 신호를 고속 푸리에 변환(Fast Fourier Transform)하여 주파수 영역으로 변환하고 소리가 발생되었는지 확인하는 과정을 포함할 수 있다. 상기 소리가 발생되었는지 확인하는 과정에서는 전체 주파수 대역을 감시하는 것이 아니라, 주요 주파수 대역만을 감시함으로써 추출에 소요되는 시간을 단축시킬 수 있다.The process of analyzing the frequency according to an exemplary embodiment may include a fast Fourier transform (FFT) of a signal input from the sound sensor or the CCTV to convert the signal into a frequency domain and checking whether sound is generated. In the process of checking whether the sound is generated, it is possible to shorten the time required for extraction by monitoring only the main frequency band, instead of monitoring the entire frequency band.

일실시예에 따른 주요 주파수 대역을 설정하는 과정은 소리(또는 사운드)가 발생되지 않았을 때와 소리(또는 사운드)가 발생되었을 때의 크기 주파수 스펙트럼을 각각 추출하여 사인-거리 계산(sine-distance calculation)을 이용하여 주파수 곡선의 변화가 가장 큰 대역을 찾는 과정을 포함할 수 있다. 주파수 대역을 설정하고 그 설정된 주파수 대역의 크기 임계값을 구하여 소리를 추출한 기준을 정할 수 있다.The process of setting the main frequency band according to an embodiment extracts a frequency spectrum of a frequency when a sound (or a sound) is not generated and a frequency when a sound (or a sound) is generated, ) May be used to find the band with the largest change in the frequency curve. A frequency band can be set, a threshold value of the set frequency band can be obtained, and a criterion for extracting sound can be determined.

일실시예에 따른 상기 획득 대상의 소리를 탐지하는 과정은 설정된 주파수 대역을 감시하면서 획득 대상에 의해 발생된 소리인지를 단시간 에너지를 이용하여 소리 정보를 획득하는 과정을 포함할 수 있다.The step of detecting the sound of the object to be acquired may include a step of acquiring sound information by using short-time energy to recognize the sound generated by the object to be acquired while monitoring the set frequency band.

도 3은 일실시예에 따른 소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템의 구성을 도시한 도면이다.3 is a diagram illustrating a configuration of a sound acquisition system for eliminating noise in an environment where noise is generated according to an embodiment.

일실시예에 따르면, 소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템(300)은 추출부(310), 판단부(320)를 포함할 수 있다.According to an embodiment, the sound acquisition system 300 for removing noise in an environment where noise is generated may include an extraction unit 310 and a determination unit 320.

일실시예에 따르면, 상기 추출부(310)는 획득 대상의 사운드 정보가 발생된 주파수 대역 구간을 추출할 수 있다. 상기 주파수 대역 구간을 추출하는 것은 전체 주파수 구간을 추출하는 것이 아니라, 주요 주파수 구간을 추출하는 것이다. 상기 주파수 구간을 추출하는 것은 사운드 정보가 발생되었을 때와 상기 사운드 정보가 발생되지 않았을 때의 크기 주파수 스펙트럼으로부터 추출할 수 있다.According to one embodiment, the extraction unit 310 may extract a frequency band interval in which sound information of an acquisition object is generated. The extraction of the frequency band section is not to extract the entire frequency section but extracts the main frequency section. The extraction of the frequency interval can be performed from the frequency spectrum when the sound information is generated and when the sound information is not generated.

구체적으로, 상기 주파수 대역 구간을 추출하는 것은 사인-거리 계산(sine-distance calculation)을 이용하고, 주파수 전체 대역 구간의 변화를 확인하여 크기(amplitude)가 임계값을 초과하는 구간을 추출하는 것일 수 있다.More specifically, the frequency band section is extracted by using a sine-distance calculation and extracting a section in which the amplitude exceeds the threshold value by confirming a change in the entire frequency band section have.

사인-거리 계산(sine-distance calculation)은 [수학식 1]과 같이 계산된다. 크기 스펙트럼(magnitude spectrum)이 주어졌을 때, 주파수 지점 근처의 개 주파수 지점들 간의 거리를 계산한다. 이는 크기(magnitude)의 차이점을 없애고 오직 주파수 형태(shape)만을 비교하는 것이다.The sine-distance calculation is calculated as shown in Equation (1). Given a magnitude spectrum, calculate the distances between the individual frequency points near the frequency point. This eliminates the difference in magnitude and only compares the frequency shapes.

Figure 112013057758640-pat00001
Figure 112013057758640-pat00001

S(k)는 magnitude frequency spectrum의 k번째 주파수이고, M은 k번째 주파수로 부터 거리를 구할 주변 주파수 개수이다. 보통 3으로 설정할 수 있다. W(k)는 k번째의 프레임 윈도우(frame window)이다.S (k) is the kth frequency of the magnitude frequency spectrum, and M is the number of the surrounding frequencies to obtain the distance from the kth frequency. You can usually set it to 3. W (k) is the kth frame window.

일실시예에 따라, 프레인 윈도우(frame window)는 해밍 윈도우(Hamming window)일 수 있다. 해밍 윈도우(Hamming window)는 [수학식 2]와 같이 정의된다.According to one embodiment, the frame window may be a Hamming window. The Hamming window is defined as: " (2) "

Figure 112013057758640-pat00002
Figure 112013057758640-pat00002

N은 윈도우의 길이를 나타내며, 일실시예에 따라 64로 설정할 수 있다. n은 길이가 N인 윈도우의 n번째를 나타낸다. N이 64로 설정될 경우 n은 0에서 63까지의 값을 갖는다. (단, N 및 n은 정수)N represents the length of the window, and may be set to 64 according to one embodiment. n represents the n-th window of the length N. When N is set to 64, n has a value from 0 to 63. (Where N and n are integers)

일실시예에 따라 판단부(320)는 추출된 상기 주파수 대역 구간에 단시간 에너지(short-time energy)를 사용하여 상기 획득 대상의 상기 사운드 정보인지 판단할 수 있다.According to an embodiment, the determination unit 320 may determine whether the sound information is the sound information of the acquisition target using the short-time energy in the extracted frequency band interval.

다른 실시예에 따라 상기 판단부(320)가 상기 단시간 에너지(short-time energy)를 사용하는 것은 상기 사운드 정보의 제곱값에 윈도우 함수를 곱해줌으로써 상기 획득 대상의 상기 사운드 정보인지 판단하라 수 있다.According to another embodiment, the determination unit 320 may use the short-time energy by multiplying the squared value of the sound information by the window function to determine whether the sound information is the sound information of the acquisition target.

획득 대상의 사운드 정보를 얻고자 할 때에는 획득 대상의 사운드 뿐만 아니라 불필요한 소음들이 발생할 수 있다. 사운드 획득 시스템(300)은 추출된 주파수 대역 구간이 획득 대상에 의해 발생된 사운드인지 구분하기 위해 단시간 에너지를 사용할 수 있다. 시간 영역의 특징들 중 하나인 에너지(energy)는 신호(signal)의 제곱 값으로 구할 수 있으나 시간 변화에 따른 에너지(energy)변화를 확인하는 것이 불가능하여 단시간 에너지를 이용할 수 있다. 단시간 에너지는(short-time energy)는 신호(signal)의 제곱 값에 윈도우(window)를 곱해줌으로써 구할 수 있으며, 시간 변화에 따른 에너지(energy)변화가 확인 가능하다. 단시간 에너지(short-time energy)는 [수학식 3]과 같이 수식화 된다.When acquiring the sound information of the acquisition target, not only the sound to be acquired but also unnecessary noise may be generated. The sound acquisition system 300 may use short-time energy to distinguish whether the extracted frequency band interval is the sound generated by the acquisition object. Energy, which is one of the characteristics of the time domain, can be obtained as a squared value of a signal, but it is impossible to confirm a change in energy with time, so that a short time energy can be used. The short-time energy can be obtained by multiplying the square of the signal by a window, and the change in energy with time can be confirmed. The short-time energy is expressed by Equation (3).

Figure 112013057758640-pat00003
Figure 112013057758640-pat00003

X(m)은 m번째 신호(signal)를 나타내고, n은 윈도우(window) 크기를 나타낸다. W(n)은 n-m번째의 프레임 윈도우(frame window)를 나타낸다.X (m) denotes an m-th signal (signal), and n denotes a window size. W (n) represents the n-mth frame window.

도 4는 일실시예에 따른 사운드 획득 시스템 추출부의 세부 구성도이다.4 is a detailed configuration diagram of a sound acquisition system extracting unit according to an embodiment.

일실시예에 따라 추출부(310)는 센서부(410), 프레임 분할부(420), 변환부(430)를 포함할 수 있다. 상기 센서부(410)는 획득 대상의 상기 사운드 정보를 취득할 수 있다. 상기 프레임 분할부(420)는 상기 센서부(410)에 의해 취득된 상기 사운드 정보를 나눌 수 있다. 상기 변환부(430)는 상기 프레임 분할부(420)에 의해 나눠진 상기 사운드 정보를 고속 퓨리에 변환(Fast Fourier Transform)을 이용하여 크기 주파수 스펙트럼(magnitude frequency spectrum)으로 변환할 수 있다.The extracting unit 310 may include a sensor unit 410, a frame dividing unit 420, and a converting unit 430 according to an embodiment of the present invention. The sensor unit 410 can acquire the sound information of the acquisition target. The frame division unit 420 may divide the sound information acquired by the sensor unit 410. [ The converting unit 430 may convert the sound information divided by the frame dividing unit 420 into a magnitude frequency spectrum using Fast Fourier Transform (FFT).

도 5는 일실시예에 따른 주파수 영역에서 획득 대상이 발생시키는 사운드의 신호와 소음 신호를 나타내는 그래프이다.5 is a graph showing a sound signal and a noise signal generated by an acquisition object in a frequency domain according to an embodiment.

단시간 에너지를 이용하여 획득 대상의 사운드 정보를 얻기 전에 획득 대상의 사운드 정보인지를 판단하기 위하여 신호 구간을 설정(500)할 수 있다.The signal section may be set (500) to determine whether the sound information of the acquisition target is acquired before obtaining the sound information of the acquisition target using the short-time energy.

상기 신호 구간은 주파수 대역을 분석하여 설정할 수 있다. 전체 주파수 대역을 설정하여 단기간 에너지를 이용하는 것이 아니라, 주요 주파수 대역만을 추출하여 획득 대상으로부터 사운드가 발생하였는지 판단할 수 있다.The signal interval may be set by analyzing a frequency band. It is possible to determine whether a sound is generated from the object to be acquired by extracting only the main frequency band instead of using the short-term energy by setting the entire frequency band.

주요 주파수 대역을 추출하는 방법은, 소리센서로부터 입력되는 신호를 고속 퓨리에 변환을 이용하여 주파수 영역으로 변환한다. 주파수 영역으로 변환한 후, 크기 주파수 스펙트럼(magnitude frequency spectrum)을 구한다. 크기 주파수 스펙트럼으로부터 소리가 발생되지 않았을 때와 소리가 발생되었을 때를 각각 추출하여 주파수 곡선의 변화가 가장 큰 대역을 찾는다. 주파수 변화가 있는지는 상기한 바와 같이 [수학식 1] 및 [수학식 2]를 통해 알 수 있다.A method for extracting a main frequency band converts a signal input from a sound sensor into a frequency domain using a fast Fourier transform. After converting to the frequency domain, the magnitude frequency spectrum is obtained. Size Extracts the frequency when the sound is not generated and the sound when it is generated from the spectrum, and finds the band with the largest change in the frequency curve. Whether or not there is a frequency change can be found from the equations (1) and (2) as described above.

일실시예에 따라 도 5에서 도시된 그래프를 살펴보면, 510은 돼지의 축사에서 돼지의 기침소리를 나타내는 주파수 신호를 나타낸 것이다. 520은 돼지의 축사에서 돼지에 의해 발생된 소리가 아닌 소음을 나타내는 주파수 신호를 나타낸 것이다. 소음은 축사의 환기 펜 혹은 주변 소음들을 가리킬 수 있다. 530은 돼지의 기침소리를 나타내는 신호와 소음을 나타내는 신호 간에 차이가 많이 나는 구간을 설정한 것이다.Referring to the graph shown in FIG. 5 according to an embodiment, reference numeral 510 denotes a frequency signal indicating a coughing sound of a pig in a pig house. 520 is a frequency signal that represents noise, not noise, produced by pigs in a pig house. Noise can indicate ventilator pen or ambient noise. 530 sets the interval in which there is a lot of difference between the signal indicating the cough of the pig and the signal indicating the noise.

일실시예에 따라 설정된 구간이 획득 대상에 의해 발생되니 소리인지는 단시간 에너지를 이용하여 판단할 수 있다.According to one embodiment, the set interval is generated by the acquisition object, so that it can be judged by using the short-time energy.

도 6은 일실시예에 따른 소음이 발생되는 환경에서 획득 대상의 사운드 획득 방법을 설명하기 위한 구체적인 흐름도(600)이다.6 is a specific flowchart 600 for explaining a method of acquiring sound of an object to be acquired in an environment where noise is generated according to an embodiment.

단계(601)은 획득 대상에서 사운드 신호가 방출하는 단계이다. 사운드 획득 시스템은 추출부 중 센서부에서 상기 획득 대상의 사운드 정보를 수신한다. 상기 센서부는 상기 획득 대상의 상기 사운드 정보 뿐만 아니라 소음도 수신할 수 있다.Step 601 is a step in which the sound signal is emitted from the object to be acquired. The sound acquisition system receives the sound information of the acquisition object from the sensor unit of the extraction unit. The sensor unit may receive noise as well as the sound information of the object to be acquired.

단계(602)는 수신한 상기 획득 대상의 상기 사운드 정보를 프레임 분할부에서 나눌 수 있다.Step 602 may divide the received sound information of the object to be acquired in the frame dividing unit.

단계(604)는 상기 프레임 분할부에 의해 나눠진 상기 사운드 정보를 해밍 윈도우를 적용하여 고속 퓨리에 변환을 할 수 있다.In operation 604, the sound information divided by the frame division unit may be subjected to fast Fourier transform by applying a hamming window.

단계(605)는 상기 고속 퓨리에 변환을 하여 신호를 주파수 영역으로 이동시키고 이로부터 크기 주파수 스펙트럼을 얻을 수 있다. 사운드 획득 시스템은 소리 발생 시 전체 주파수 대역을 감시하는 것이 아니라 주요 주파수 대역만을 감시함으로써 소리 추출에 소요되는 시간을 단축시키며 생활 소음에 의해 발생된 소리와 획득 대상에 의해 발생된 소리를 구분하고 있다.In step 605, the fast Fourier transform is performed to shift the signal to the frequency domain and obtain a magnitude frequency spectrum therefrom. The sound acquisition system monitors not only the entire frequency band but also the main frequency band, thereby shortening the time required for sound extraction and distinguishing the sound generated by the living noise from the sound generated by the acquisition target.

단계(606)은 주요 주파수 대역을 추출하기 위해서는 획득 대상의 사운드가 발생되었을 때와 상기 획득 대상의 상기 사운드가 발생되지 않았을 때의 크기 주파수 스펙트럼을 각각 추출하여 사인-거리 계산으로 주파수 곡선의 변화가 큰 대역을 찾는다. 찾아낸 주파수 대역의 크기(amplitude) 임계값을 구하여 상기 사운드를 추출할 기준을 정할 수 있다.In step 606, in order to extract a main frequency band, a magnitude frequency spectrum when the sound of the acquisition object is generated and a sound frequency when the sound of the acquisition object is not generated are respectively extracted. Find a large band. A criterion for extracting the sound can be determined by obtaining an amplitude threshold value of the found frequency band.

단계(607)은 상기 추출된 주파수 대역 구간이 획득 대상에 의해 발생된 소리인지 단시간 에너지(short-time energy)를 이용하여 판단할 수 있다. 판단부가 상기 단시간 에너지(short-time energy)를 이용하는 것은 상기 사운드 정보의 제곱값에 윈도우 함수를 곱해줌으로써 상기 획득 대상의 상기 사운드 정보인지 판단하는 것이다.Step 607 may determine the extracted frequency band interval using the sound or short-time energy generated by the object to be acquired. The determination unit uses the short-time energy to determine whether the sound information is the sound information of the acquisition object by multiplying the square value of the sound information by a window function.

단계(608)은 단계(607)에서 얻은 정보로 시간 변화에 따른 에너지 변화를 확인할 수 있다.Step 608 can confirm the change in energy with time according to the information obtained in step 607.

단계(609)는 획득 대상의 사운드 정보를 추출하여 파일 형태로 저장할 수 있다. 파일로 저장될 시 음절단위로 저장될 수 있다.Step 609 can extract the sound information of the acquisition object and store it in a file form. When stored as a file, it can be stored in syllable units.

도 7은 일실시예에 따른 획득 대상의 사운드 소리와 소음의 파형 및 스펙트럼을 나타내는 도면(700)이다.FIG. 7 is a diagram 700 illustrating sound and sound waveforms and spectra of sound to be acquired according to an embodiment.

일실시예에 따른 획득 대상의 사운드 파형(710)에서 가로축은 시간을 나타내고, 세로축은 신호의 크기를 나타낸다. 파형에서 신호의 크기가 큰 부분을 추출할 수 있다.In the sound waveform 710 of the object to be acquired according to the embodiment, the horizontal axis represents time and the vertical axis represents the size of the signal. A portion having a large signal size can be extracted from the waveform.

다른 실시예에 따른 획득 대상의 스펙트럼(720)에서 가로축은 시간을 나타내고, 세로축은 주파수를 나타낸다. 스펙트럼에서 획득 대상의 spectral이 큰 부분을 추출할 수 있다.In the spectrum 720 of the acquisition target according to another embodiment, the horizontal axis represents time and the vertical axis represents frequency. In the spectrum, we can extract a large spectral part of the acquisition target.

또 다른 실시예에 따른 소음의 파형(730)에서 가로축은 시간을 나타내고, 세로축은 신호의 크기를 나타낸다. 파형에서 신호의 크기가 큰 부분을 추출할 수 있다.In a noise waveform 730 according to another embodiment, the horizontal axis represents time and the vertical axis represents the magnitude of the signal. A portion having a large signal size can be extracted from the waveform.

또 다른 실시예에 따른 소음의 스펙트럼(740)에서 가로축은 시간을 나타내고, 세로축은 주파수를 나타낸다. 스펙트럼에서 획득 대상의 spectral이 큰 부분을 추출할 수 있다.In a noise spectrum 740 according to another embodiment, the horizontal axis represents time and the vertical axis represents frequency. In the spectrum, we can extract a large spectral part of the acquisition target.

도 8은 일실시예에 따른 획득 대상의 사운드 파형을 나타내는 실시예를 나타내는 도면이다.8 is a diagram showing an embodiment showing a sound waveform of an acquisition target according to an embodiment.

일실시예에 따라 800은 여러 획득 대상의 사운드 파형을 보여준다. 810은 동물의 기침 소리를 나타낸 사운드 파형이고, 820은 동물의 비명 소리를 나타내는 사운드 파형이다. 830은 동물의 발자국 소리를 나타내는 사운드 파형이다.According to one embodiment, 800 shows the sound waveforms of various acquisition targets. 810 is a sound waveform representing an animal's coughing sound, and 820 is a sound waveform representing an animal's screaming sound. 830 is a sound waveform representing the animal's footstep sound.

이상에서 설명된 시스템은 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 시스템 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 시스템과 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 시스템은 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 시스템은 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 시스템은 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 시스템이 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 시스템은 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The system described above may be implemented with hardware components, software components, and / or a combination of hardware components and software components. For example, the systems and components described in the embodiments may be implemented within a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable array (FPA) A programmable logic unit (PLU), a microprocessor, or any other system capable of executing and responding to instructions. The processing system may execute an operating system (OS) and one or more software applications running on the operating system. The processing system may also access, store, manipulate, process, and generate data in response to execution of the software. For ease of understanding, a processing system may be described as being used alone, but one of ordinary skill in the art will recognize that the processing system may be implemented using a plurality of processing elements and / As shown in FIG. For example, the processing system may include a plurality of processors or one processor and one controller. Other processing configurations are also possible, such as a parallel processor.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 시스템에 의하여 해석되거나 처리 시스템에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 시스템, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may include a computer program, code, instructions, or a combination of one or more of the foregoing, and may be configured to configure the processing device to operate as desired or to process it collectively or collectively Device can be commanded. Software and / or data may be stored on any type of machine, component, physical device, virtual equipment, computer storage media, or system, including, but not limited to, , Or may be permanently or temporarily embodied in a transmitted signal wave. The software may be distributed over a networked computer system and stored or executed in a distributed manner. The software and data may be stored on one or more computer readable recording media.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method according to an embodiment may be implemented in the form of a program command that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, and the like, alone or in combination. The program instructions to be recorded on the medium may be those specially designed and configured for the embodiments or may be available to those skilled in the art of computer software. Examples of computer-readable media include magnetic media such as hard disks, floppy disks and magnetic tape; optical media such as CD-ROMs and DVDs; magnetic media such as floppy disks; Magneto-optical media, and hardware devices specifically configured to store and execute program instructions such as ROM, RAM, flash memory, and the like. Examples of program instructions include machine language code such as those produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter or the like. The hardware devices described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments. For example, it is to be understood that the techniques described may be performed in a different order than the described methods, and / or that components of the described systems, structures, devices, circuits, Lt; / RTI > or equivalents, even if it is replaced or replaced.

그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.Therefore, the scope of the present invention should not be limited to the described embodiments, but should be determined by the equivalents of the claims, as well as the claims.

Claims (11)

획득 대상의 사운드 정보가 발생되었을 때와 상기 사운드 정보가 발생되지 않았을 때의 크기 주파수 스펙트럼으로부터 상기 사운드 정보가 발생된 주파수 대역 구간을 추출하는 추출부; 및
추출된 상기 주파수 대역 구간에 단시간 에너지(short-time energy)를 사용하여 상기 획득 대상의 상기 사운드 정보인지 판단하는 판단부
를 포함하고,
상기 추출부는
상기 획득 대상의 상기 사운드 정보를 취득하는 센서부;
상기 센서부에 의해 취득된 상기 사운드 정보를 나누는 프레임 분할부; 및
상기 프레임 분할부에 의해 나눠진 상기 사운드 정보를 FFT(Fast Fourier Transform)를 이용하여 상기 크기 주파수 스펙트럼(magnitude frequency spectrum)으로 변환하는 변환부
를 포함하는 사운드 획득 시스템.
An extracting unit for extracting a frequency band interval in which the sound information is generated from a magnitude frequency spectrum when sound information of an acquisition target is generated and when the sound information is not generated; And
Determining whether the sound information is the sound information of the acquisition target using the short-time energy in the extracted frequency band section;
Lt; / RTI >
The extracting unit
A sensor unit for acquiring the sound information of the acquisition object;
A frame dividing unit dividing the sound information acquired by the sensor unit; And
A converting unit for converting the sound information divided by the frame dividing unit into a magnitude frequency spectrum using Fast Fourier Transform (FFT)
/ RTI >
삭제delete 삭제delete 제1항에 있어서,
상기 주파수 대역 구간을 추출하는 것은 사인-거리 계산(sine-distance calculation)을 이용하고, 상기 주파수 대역 구간의 변화를 확인하여 크기(amplitude)가 임계값을 초과하는 구간을 설정하고 추출하는 것으로 하는 사운드 획득 시스템.
The method according to claim 1,
The frequency band section is extracted by using a sine-distance calculation and by setting a section in which the amplitude exceeds the threshold value by confirming the change of the frequency band section, Acquisition system.
삭제delete 사운드 정보를 취득하는 단계;
상기 취득된 사운드 정보를 나누고, 나눠진 상기 사운드 정보를 FFT(Fast Fourier Transform)를 이용하여 크기 주파수 스펙트럼(magnitude frequency spectrum)으로 변환하는 단계;
획득 대상의 사운드 정보가 발생되었을 때와 상기 사운드 정보가 발생되지 않았을 때의 상기 크기 주파수 스펙트럼으로부터 상기 사운드 정보가 발생된 주파수 대역 구간을 추출하는 단계; 및
추출된 상기 주파수 대역 구간에 단시간 에너지(short-time energy)를 사용하여 상기 획득 대상의 상기 사운드 정보인지 판단하는 단계
를 포함하는 사운드 획득 방법.
Acquiring sound information;
Dividing the acquired sound information, and converting the divided sound information into a magnitude frequency spectrum using an FFT (Fast Fourier Transform);
Extracting a frequency band interval in which the sound information is generated from the magnitude frequency spectrum when the sound information of the acquisition object is generated and when the sound information is not generated; And
Determining whether the sound information is the sound information of the object to be acquired using the short-time energy in the extracted frequency band section
/ RTI >
삭제delete 삭제delete 제6항에 있어서,
상기 주파수 대역 구간을 추출하는 단계는 사인-거리 계산(sine-distance calculation)을 이용하고, 상기 주파수 대역 구간의 변화를 확인하여 크기(amplitude)가 임계값을 초과하는 구간을 설정하고 추출하는 사운드 획득 방법.
The method according to claim 6,
Wherein the step of extracting the frequency band section comprises the steps of: using a sine-distance calculation, determining a change in the frequency band interval, setting and extracting a section in which amplitude exceeds a threshold value, Way.
돈사 내에서 돼지의 제1 사운드 정보를 포함하는 사운드 정보를 수신하는 단계;
상기 수신한 사운드 정보를 크기 주파수 스펙트럼으로 변환하고, 상기 크기 주파수 스펙트럼으로부터 상기 제1 사운드 정보에 대응하는 사운드 구간을 추출하는 단계;
상기 추출된 사운드 구간에 시간 변화에 따른 상기 돼지의 에너지 변화를 확인하는 단시간 에너지 함수를 적용하여 상기 돼지의 제1 사운드 정보인지를 판단하는 단계
를 포함하는 사운드 획득 방법.
The method comprising: receiving sound information including first sound information of a pig in a piggy bank;
Converting the received sound information into a magnitude frequency spectrum and extracting a sound interval corresponding to the first sound information from the magnitude frequency spectrum;
Determining a first sound information of the pig by applying a short-time energy function for confirming a change in energy of the pig according to a time change in the extracted sound section
/ RTI >
제10항에 있어서,
상기 단시간 에너지 함수의 적용은,
상기 추출된 사운드 구간의 신호 값을 제곱하고, 윈도우 함수를 곱하는 사운드 획득 방법.
11. The method of claim 10,
The application of the short-
And squaring the signal value of the extracted sound section and multiplying the signal value by the window function.
KR20130074491A 2013-06-27 2013-06-27 Sound acquisition system to remove noise in the noise environment KR101491911B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20130074491A KR101491911B1 (en) 2013-06-27 2013-06-27 Sound acquisition system to remove noise in the noise environment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20130074491A KR101491911B1 (en) 2013-06-27 2013-06-27 Sound acquisition system to remove noise in the noise environment

Publications (2)

Publication Number Publication Date
KR20150011854A KR20150011854A (en) 2015-02-03
KR101491911B1 true KR101491911B1 (en) 2015-02-12

Family

ID=52488093

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20130074491A KR101491911B1 (en) 2013-06-27 2013-06-27 Sound acquisition system to remove noise in the noise environment

Country Status (1)

Country Link
KR (1) KR101491911B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101897181B1 (en) * 2017-08-18 2018-09-13 주식회사 크레스프리 Method and apparatus for analyzing an actuator

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106601233A (en) * 2016-12-22 2017-04-26 北京元心科技有限公司 Voice command recognition method and device and electronic equipment
CN108491180B (en) * 2018-03-16 2021-05-18 北京小米移动软件有限公司 Audio playing method and device

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100394759B1 (en) 1995-02-17 2004-02-11 소니 가부시끼 가이샤 Method and apparatus for reducing noise in voice signals
KR20070050271A (en) * 2005-11-10 2007-05-15 삼성전자주식회사 Method and apparatus for detecting event using audio data
KR20120103286A (en) * 2011-03-10 2012-09-19 최길준 Method and apparatus of detecting event of interest related to vehicles using audio signals

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100394759B1 (en) 1995-02-17 2004-02-11 소니 가부시끼 가이샤 Method and apparatus for reducing noise in voice signals
KR20070050271A (en) * 2005-11-10 2007-05-15 삼성전자주식회사 Method and apparatus for detecting event using audio data
KR20120103286A (en) * 2011-03-10 2012-09-19 최길준 Method and apparatus of detecting event of interest related to vehicles using audio signals

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101897181B1 (en) * 2017-08-18 2018-09-13 주식회사 크레스프리 Method and apparatus for analyzing an actuator

Also Published As

Publication number Publication date
KR20150011854A (en) 2015-02-03

Similar Documents

Publication Publication Date Title
CN110383375B (en) Method and apparatus for detecting cough in noisy background environment
CN111445905B (en) Mixed voice recognition network training method, mixed voice recognition method, device and storage medium
KR102605736B1 (en) Method and apparatus of sound event detecting robust for frequency change
CN108701469B (en) Cough sound recognition method, device, and storage medium
CN109599120B (en) Abnormal mammal sound monitoring method based on large-scale farm plant
US9489965B2 (en) Method and apparatus for acoustic signal characterization
KR20200115731A (en) Method and apparatus for recognition of sound events based on convolutional neural network
CN105989836B (en) Voice acquisition method and device and terminal equipment
EP2905780A1 (en) Voiced sound pattern detection
US20090125304A1 (en) Method and apparatus to detect voice activity
JP2009008823A (en) Sound recognition device, sound recognition method and sound recognition program
AU2013204156B2 (en) Classification apparatus and program
CN106548786B (en) Audio data detection method and system
CN117076941B (en) Optical cable bird damage monitoring method, system, electronic equipment and readable storage medium
Zeppelzauer et al. Acoustic detection of elephant presence in noisy environments
KR101491911B1 (en) Sound acquisition system to remove noise in the noise environment
KR20160096905A (en) Apparatus and method for detecting snoring
CN109377982B (en) Effective voice obtaining method
JP2010197998A (en) Audio signal processing system and autonomous robot having such system
KR20170101500A (en) Method and apparatus for identifying audio signal using noise rejection
KR101116279B1 (en) Apparatus for discriminating man from object using sensor
Xie et al. Detection of anuran calling activity in long field recordings for bio-acoustic monitoring
CN115023183A (en) Method and apparatus for automatic cough detection
CN107894837A (en) Dynamic sentiment analysis model sample processing method and processing device
KR20210131067A (en) Method and appratus for training acoustic scene recognition model and method and appratus for reconition of acoustic scene using acoustic scene recognition model

Legal Events

Date Code Title Description
AMND Amendment
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180118

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20190207

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20200106

Year of fee payment: 6