[TIL] LCS 알고리즘

TIL/Python

[TIL] LCS 알고리즘

아람2 2024. 9. 30. 10:52

LCS 알고리즘

Longest Common Subsequence 최장 공통 부분 수열
또는 Longest Common Substring 최장 공통 부분 문자열

Longest Common Substring

두 개 이상의 문자열에서 연속적으로 나타나는 가장 긴 부분 문자열 찾기

부분 문자열은 주어진 문자열의 연속된 부분을 의미한다

원래 문자열에서 특정 시작 위치에서부터 특정 끝 위치까지의 모든 문자를 포함한다

이는 문자들이 연속적으로 이어져 있어야 하며, 반드시 전체 문자열의 일부분이어야 한다

ex. 문자열 abcde 에서 bcd 는 부분 문자열이지만 acd 는 부분 문자열이 아니다

Longest Common Substring 찾는 방법

1. 문자열 A, 문자열 B 를 한 글자씩 비교해 보기

2. 두 문자가 다르다면 LCS[i][j] 에 0 표시하기

3. 두 문자가 같다면 LCS[i-1][j-1] 에서 + 1 하기

if i == 0 or j == 0:  # 마진 설정
	LCS[i][j] = 0
elif string_A[i] == string_B[j]:
	LCS[i][j] = LCS[i - 1][j - 1] + 1
else:
	LCS[i][j] = 0

Longest Common Subsequence

두 개 이상의 문자열에서 공통으로 나타나는 가장 긴 부분 수열을 찾는 문제

부분 수열은 원래 수열에서 일부 요소를 선택하여 순서를 유지하면서 만들어지는 수열이다

ex. 문자열 abcde 에서 ace 는 부분 수열이지만 ca 는 부분 수열이 아니다

Longest Common Substring 찾는 방법

1. 문자열 A, 문자열 B 를 한 글자씩 비교해 보기

2. 두 문자가 다르다면 LCS[i-1][j] 와 LCS[i][j-1] 중에 큰 값을 표시하기 (왼쪽 값과 위쪽 값)

3. 두 문자가 같다면 LCS[i-1][j-1] 에서 + 1 하기

부분 수열은 연속된 값이 아니기 때문에 현재의 문자를 비교하는 과정 이전의 최대 공통 부분 수열은 계속해서 유지한다

'현재의 문자를 비교하는 과정' 이전의 과정이 LCS[i-1][j] 와 LCS[i][j-1]

if i == 0 or j == 0:  # 마진 설정
	LCS[i][j] = 0
elif string_A[i] == string_B[j]:
	LCS[i][j] = LCS[i - 1][j - 1] + 1
else:
	LCS[i][j] = max(LCS[i - 1][j], LCS[i][j - 1])

문자열 A "ACATKP" 과 문자열 B "CAPCAK" 을 비교한 내용을 표로 정리하면 아래와 같다

	A	C	A	Y	K	P
0	0	0	0	0	0	0
C	0	1	1	1	1	1
A	1	1	2	2	2	2
P	1	1	2	2	2	3
C	1	2	2	2	2	3
A	1	2	3	3	3	3
K	1	2	3	3	4	4

0 인 행렬을 추가한 이유는 비교 과정에서 대각선 +1 과 왼쪽/ 위쪽 비교를 위해서 추가했고,

그렇기 때문에 for 문의 범위를 m/ n+1 까지로 설정하여 첫번째 행과 열이 0으로 초기화된 상태에서 비교가 가능하다

X 처리한 부분이 대각선 +1 된 부분이다

LCS 참고한 블로그

'TIL > Python' 카테고리의 다른 글

[TIL] B-Tree, B-트리 (1)	2024.10.04
[TIL] 배낭 문제 Knapsack Problem (0)	2024.10.01
[TIL] 그리디 알고리즘 Greedy Algorithm (0)	2024.09.29
[TIL] 다이나믹 프로그래밍 Dynamic Programming, DP (3)	2024.09.27
[TIL] 최소 신장 트리 MST, Minimum Spanning Tree (0)	2024.09.25

현재글[TIL] LCS 알고리즘

helloahram

개발자꿈나무 루아

백준, 파이썬, 혼공컴운, 자바, 정글, 크래프톤정글, Python, 영속성, Java, 티스토리챌린지, 메모리, 정글7기, playwright, pintos, 오블완, OSTEP, 혼자공부하는컴퓨터구조운영체제, 운영체제, CPU, docker,

Today :
Yesterday :

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

helloahram