

 Amazon Redshift는 패치 198부터 새 Python UDF 생성을 더 이상 지원하지 않습니다. 기존 Python UDF는 2026년 6월 30일까지 계속 작동합니다. 자세한 내용은 [블로그 게시물](https://aws.amazon.com/blogs/big-data/amazon-redshift-python-user-defined-functions-will-reach-end-of-support-after-june-30-2026/)을 참조하세요.

# REGEXP\_COUNT 함수
<a name="REGEXP_COUNT"></a>

문자열에서 정규 표현식 패턴을 검색한 후 해당 패턴 발생 횟수를 나타내는 정수를 반환합니다. 일치하는 결과가 발견되지 않으면 함수가 `0`을 반환합니다. 정규 표현식에 관한 자세한 내용은 [POSIX 연산자](pattern-matching-conditions-posix.md) 섹션 및 Wikipedia의 [정규 표현식](https://en.wikipedia.org/wiki/Regular_expression)을 참조하세요.

## 구문
<a name="REGEXP_COUNT-synopsis"></a>

```
REGEXP_COUNT( source_string, pattern [, position [, parameters ] ] )
```

## 인수
<a name="REGEXP_COUNT-arguments"></a>

 *source\_string*   
`CHAR` 또는 `VARCHAR` 문자열입니다.

 *pattern*   
정규 표현식 패턴을 나타내는 UTF-8 문자열 리터럴입니다. 자세한 내용은 [POSIX 연산자](pattern-matching-conditions-posix.md) 섹션을 참조하세요.

 *position*   
(선택) 검색을 시작할 **source\_string 내 위치를 나타내는 양수 `INTEGER`입니다. 이 위치는 바이트가 아닌 문자 수를 기준으로 하기 때문에 멀티바이트 문자도 단일 문자로 계산됩니다. 기본값은 `1`입니다. **position이 `1`보다 작으면 검색이 **source\_string의 첫 문자부터 시작됩니다. **position이 **source\_string의 문자 수보다 크면 결과는 `0`이 됩니다.

 *parameters*   
(선택) 함수가 패턴과 일치하는 방법을 나타내는 하나 이상의 문자열 리터럴입니다. 가능한 값은 다음과 같습니다.  
+ c - 대/소문자를 구분하여 일치시킵니다. 기본값은 대/소문자 구분 일치를 사용하는 것입니다.
+ i - 대/소문자를 구분하지 않고 일치시킵니다.
+ p – PCRE(Perl Compatible Regular Expression) 방언으로 패턴을 해석합니다. PCRE에 관한 자세한 내용은 Wikipedia의 [펄 호환 정규 표현식](https://en.wikipedia.org/wiki/Perl_Compatible_Regular_Expressions)을 참조하세요.

## 반환 타입
<a name="REGEXP_COUNT-return-type"></a>

INTEGER

## 예제
<a name="REGEXP_COUNT-examples"></a>

3자 시퀀스가 발생하는 횟수를 계산하려면 다음 예제를 사용합니다.

```
SELECT REGEXP_COUNT('abcdefghijklmnopqrstuvwxyz', '[a-z]{3}');

+--------------+
| regexp_count |
+--------------+
|            8 |
+--------------+
```

대/소문자를 구분하지 않는 일치를 사용하여 문자열 `FOX`의 발생 횟수를 계산하려면 다음 예제를 사용합니다.

```
SELECT REGEXP_COUNT('the fox', 'FOX', 1, 'i');

+--------------+
| regexp_count |
+--------------+
|            1 |
+--------------+
```

PCRE 방언으로 작성된 패턴을 사용하여 하나 이상의 숫자와 하나의 소문자가 포함된 단어를 찾으려면 다음 예제를 사용합니다. 이 예에서는 `?=` 연산자를 사용하는데, 이 연산자는 PCRE에서 특정 앞을 내다보는 의미를 갖습니다. 이 예에서는 대/소문자를 구분하여 일치하는 단어의 발생 횟수를 계산합니다.

```
SELECT REGEXP_COUNT('passwd7 plain A1234 a1234', '(?=[^ ]*[a-z])(?=[^ ]*[0-9])[^ ]+', 1, 'p');

+--------------+
| regexp_count |
+--------------+
|            2 |
+--------------+
```

PCRE 방언으로 작성된 패턴을 사용하여 하나 이상의 숫자와 하나의 소문자가 포함된 단어를 찾으려면 다음 예제를 사용합니다. PCRE에서 특정한 의미를 지닌 `?=` 연산자가 사용됩니다. 이 예는 이러한 단어의 발생 횟수를 계산하지만 대/소문자를 구분하지 않는 일치를 사용한다는 점에서 이전 예와 다릅니다.

```
SELECT REGEXP_COUNT('passwd7 plain A1234 a1234', '(?=[^ ]*[a-z])(?=[^ ]*[0-9])[^ ]+', 1, 'ip');

+--------------+
| regexp_count |
+--------------+
|            3 |
+--------------+
```

다음 예제에서는 TICKIT 샘플 데이터베이스의 USERS 테이블 데이터를 사용합니다. 자세한 내용은 [샘플 데이터베이스](c_sampledb.md) 섹션을 참조하세요.

최상위 도메인 이름이 `org` 또는 `edu`인 횟수를 계산하려면 다음 예제를 사용합니다.

```
SELECT email, REGEXP_COUNT(email,'@[^.]*\.(org|edu)') FROM users
ORDER BY userid LIMIT 4;

+-----------------------------------------------+--------------+
|                     email                     | regexp_count |
+-----------------------------------------------+--------------+
| Etiam.laoreet.libero@sodalesMaurisblandit.edu |            1 |
| Suspendisse.tristique@nonnisiAenean.edu       |            1 |
| amet.faucibus.ut@condimentumegetvolutpat.ca   |            0 |
| sed@lacusUtnec.ca                             |            0 |
+-----------------------------------------------+--------------+
```