문제 풀이

86. H-Index (파이썬)

zhelddustmq 2024. 7. 5. 11:31

문제 설명

H-Index는 과학자의 생산성과 영향력을 나타내는 지표입니다. 어느 과학자의 H-Index를 나타내는 값인 h를 구하려고 합니다. 위키백과1에 따르면, H-Index는 다음과 같이 구합니다.

어떤 과학자가 발표한 논문 n편 중, h번 이상 인용된 논문이 h편 이상이고 나머지 논문이 h번 이하 인용되었다면 h의 최댓값이 이 과학자의 H-Index입니다.

어떤 과학자가 발표한 논문의 인용 횟수를 담은 배열 citations가 매개변수로 주어질 때, 이 과학자의 H-Index를 return 하도록 solution 함수를 작성해주세요.

제한사항
  • 과학자가 발표한 논문의 수는 1편 이상 1,000편 이하입니다.
  • 논문별 인용 횟수는 0회 이상 10,000회 이하입니다.
입출력 예
citations return
[3, 0, 6, 1, 5] 3
입출력 예 설명

이 과학자가 발표한 논문의 수는 5편이고, 그중 3편의 논문은 3회 이상 인용되었습니다. 그리고 나머지 2편의 논문은 3회 이하 인용되었기 때문에 이 과학자의 H-Index는 3입니다.

  1. https://en.wikipedia.org/wiki/H-index "위키백과" 

 

 

정답 코드(내 풀이):

import collections


# 인용된 숫자만큼 카운팅해주고, 인용된 수가 큰 수부터 확인하면서 H-Index찾기
def solution(citations):
    answer = 0
    # 만약 인용된 횟수가 4인 논문이 두 편이고, 인용된 횟수가 3인 논문이 한 편이다 그러면
    # 인용된 횟수가 3이상인 것은 총 세 편이다.
    # 이 말은 즉, H-Index를 찾을때까지 인용이 큰 수부터 나왔던 횟수를 저장하는 변수 필요
    temp = 0

    # 몇번 인용됐는지 세고
    citations = collections.Counter(citations)

    # 제일 많이 인용된 순으로 정렬한 다음
    citations = list(sorted(citations.items(), key=lambda x: x[0], reverse=True))

    # 큰 수부터 비교하면서
    for i in range(len(citations)):
        # citations[i][0]번 인용된 횟수보다
        # citations[i][1] + temp 가 많다면 H-Index
        # 이때, citations[i][1]은 citations[i][0]이상 인용된 횟수를 의미
        if citations[i][0] <= citations[i][1] + temp:
            answer = max(citations[i][0], temp)
            return answer
        temp += citations[i][1]
    #테스트 케이스 [5] 일 경우
    answer = temp
    return answer

 

 

정답 코드(다른 사람 풀이):

def solution(citations):
    citations.sort(reverse=True)
    answer = max(map(min, enumerate(citations, start=1)))
    return answer