본문 바로가기

스터디 공간71

[Python] 고위함수(higher-order function) map(), filter(), lambda() / namedtuple 사용하기 map() 함수 map() 함수는 두 번째 인수의 연속된 요소에 첫 번째 인수(함수)를 적용한 결과를 가지는 반복 가능형 객체를 반복합니다. list(map(lambda x:x, range(1, 5))) # -> [1, 2, 3, 4] map()함수의 첫 번째 인자인 lambda 함수에 두 번째 인자인 range(1, 5) 적용한 결과로 [1, 2, 3, 4]를 반환합니다. map는 lazy evaluation으로서, 실제로 계산이 필요할때 연산을 하므로 메모리 절약에 도움이 됩니다. 그래서 list로 감싸줄 때 실제 연산을 하여, [1, 2, 3, 4]를 반환하게 됩니다. 다른 예제를 통해서 map함수를 알아보겠습니다. def factorial(n): return 1 if n> [10, 12, 18, .. 2022. 6. 24.
[Python-Leetcode] 6. Zigzag Conversion (difficulty : Medium- ☆☆) 문제 설명 The string "PAYPALISHIRING" is written in a zigzag pattern on a given number of rows like this: (you may want to display this pattern in a fixed font for better legibility) P A H N A P L S I I G Y I R And then read line by line: "PAHNAPLSIIGYIR" Write the code that will take a string and make this conversion given a number of rows: string convert(string s, int numRows); Example 1: Input: s.. 2022. 5. 9.
[Python-Leetcode] 509. Fibonacci Number (difficulty : Easy - ☆) 문제 설명 The Fibonacci numbers, commonly denoted F(n) form a sequence, called the Fibonacci sequence, such that each number is the sum of the two preceding ones, starting from 0 and 1. That is, F(0) = 0, F(1) = 1 F(n) = F(n - 1) + F(n - 2), for n > 1. Given n, calculate F(n). Example 1: Input: n = 2 Output: 1 Explanation: F(2) = F(1) + F(0) = 1 + 0 = 1. Example 2: Input: n = 3 Output: 2 Explanation.. 2022. 5. 6.
[강화학습][2] Reinforcement Learning https://jasmine46.tistory.com/81 [강화학습][1] Reinforcement LearningReinforcement Learning 원하는 작업의 달성을 위한 별도의 구체적인 지정없이 보상(Reward)과 벌칙 (Punishment)를 통한 Agent 학습 목표 : 축적된 보상을 최대화하는 control policy를 찾는 것 St : t시간의 St..jasmine46.tistory.com Bellman Equation (벨만 방정식)어떤 상태 (state)에서 value를 구할 때, 벨만 방정식을 이용합니다.이 때 다이나믹 프로그래밍 (Dynamic Programming)을 이용하여 작은 문제로 나누고 Iteration하는 방법으로 문제를 해결합니다. 기대방정식과 최적방정식으로.. 2022. 5. 5.
[강화학습][1] Reinforcement Learning Reinforcement Learning원하는 작업의 달성을 위한 별도의 구체적인 지정없이 보상(Reward)과 벌칙 (Punishment)를 통한 Agent 학습목표 : 축적된 보상을 최대화하는 control policy를 찾는 것St : t시간의 StateAt : t시간의 ActionSt+1 : t+1시간의 StateRt : RewardS1 -> R1 -> A1 -> S2 -> R2 -> A2 -> S3 .. 지속반복하는 방법을 통하여 보상을 최대화하며 최적의 Policy를 찾아보는 것입니다.위 그림에서 에이전트 (강아지)는 강화학습의 주체, 학습하는 대상이며, 각 상황(St)에서 Action을 하고 그에 따라 Environment (사람)는 보상(Reward)을 주고 다음 상태(St+1)의 정보를 .. 2022. 5. 5.
[Python-Leetcode] 13. Roman to Integer (difficulty : Easy - ☆) 문제 설명 Roman numerals are represented by seven different symbols: I, V, X, L, C, D and M. Symbol Value I 1 V 5 X 10 L 50 C 100 D 500 M 1000 For example, 2 is written as II in Roman numeral, just two one's added together. 12 is written as XII, which is simply X + II. The number 27 is written as XXVII, which is XX + V + II. Roman numerals are usually written largest to smallest from left to right. .. 2022. 5. 5.